Thursday, May 29, 2008 4:32 PM
philipbl
L’exploration de données : comment faire ? (2/3)
Nous avons vu dans le billet précédent un exemple très simple de prévisions à partir de données historiques. Nous allons aller un peu plus loin en détaillant la méthode d’analyse qui se décompose en deux parties : préparation des données et modélisation.
Détaillons les opérations de préparation dans ce message et la modélisation sera traitée dans un billet suivant. Ces opérations sont accessibles dans la partie gauche du ruban Office Excel 2007 :

Dans la phase de préparation, des assistants Excel nous guident et nous proposent différentes options.
On peut tout d’abord explorer les données et leur répartition par exemple :

On peut également supprimer les données aberrantes via ces écrans :

Et un seuil paramétrable :

Différentes options sont fournies concernant les données aberrantes que l’on peut soit supprimer, soit « normaliser », soit remplacer par une valeur moyenne ou NULL :
Autre outil fort utile l’assistant permettant de ré-étiqueter les données pour que le jeu de données soit le plus cohérent possible :
Patrick Guimonet - System Engineer Senior - IT PRO, Microsoft