La plupart des approches traditionnelles en décisionnel consiste à accumuler des données dans un entrepôt de données (DatawareHouse et Datamarts) pour ensuite les mettre à disposition des utilisateurs pour étude et analyse. Dans ce schéma, on laisse à l’humain le soin de trouver de l’information dans une masse d’informations qui peut être très importante.
Cependant, il est possible d’aller plus loin en utilisant des théories et des algorithmes statistiques sophistiqués permettant de dégager de nouvelles informations à partir de cette masse de données.
C’est le domaine de l’exploration de donnés (ou datamining en anglais). Pour reprendre les termes de Wikipédia : « L'exploration de données … a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques, et l' utilisation industrielle ou opérationnelle de ce savoir. »
En clair, on utilise des outils pour assister l’être humain dans sa démarche d’analyse.
Donc le choix serait simple : ou bien on essaie d’analyser des montagnes de données à la main (ou plutôt à l’œil :-) ) ?
Ou bien on se plonge dans la statistique pour analyser ces données ?
En fait une solution intermédiaire est possible, solution que nous détaillerons dans un prochain billet.
Patrick Guimonet - System Engineer Senior - IT PRO, Microsoft