La suite SQL Server 2008 fournit un ensemble d’outils complet pour faire de l’analyse de données multidimensionnelle (Analysis Services 2008) mais aussi de l’analyse prédictive (Datamining dans Analysis Services 2008).

Le DataMining permet d’utiliser l’information que l’on détient pour prédire l’information de demain. Beaucoup de scénarios d’entreprises se prêtent à cette analyse prédictive :

- La météo !

- Le « credit scoring » très utilisé dans la banque / finance

- Le « score d’appétence » utilisé dans le retail

Le DataMining permet alors de :

- Réaliser des analyses prédictives,

- Créer des associations,

- Identifier des structures récurrentes,

- Analyser des relations causales,

- Segmenter …

Le DataMining est aujourd’hui utilisé dans un grand nombre de domaines tel que le retail, la banque, les assurances, investigation sur la fraude, la pharmacie …

Le monde de l’Olap est étroitement lié au DataMining, c’est pourquoi leur intégration est conjointe dans l’outil Analysis Services 2008. L’objectif global est d’extraire, identifier de l’information utile contenue dans un / plusieurs ensembles de données existantes.

Pour répondre aux différents besoins des entreprises, l’outil Microsoft Analysis Services 2008 dispose de plusieurs algorithmes permettant d’adresser la plupart des cas concrets d’études :

- Decision Trees

- Clustering

- Time Series

- Sequence Clustering

- Neural Networks

- Naive Bayes

- Association Rules …

Ces algorithmes et leurs applications seront détaillés dans un prochain sujet.

image 

Exemple d’exploitation de données de clustering

 

Frédéric Gisbert - Consultant, Microsoft