Nous avons vu dans le billet précédent un exemple très simple de prévisions à partir de données historiques. Nous allons aller un peu plus loin en détaillant la méthode d’analyse qui se décompose en deux parties : préparation des données et modélisation.

Détaillons les opérations de préparation dans ce message et la modélisation sera traitée dans un billet suivant. Ces opérations sont accessibles dans la partie gauche du ruban Office Excel 2007 :

ExploDonnées6

Dans la phase de préparation, des assistants Excel nous guident et nous proposent différentes options.

On peut tout d’abord explorer les données et leur répartition par exemple :

              ExploDonnées7

On peut également supprimer les données aberrantes via ces écrans :

ExploDonnées9ExploDonnées8  

Et un seuil paramétrable :

              ExploDonnées10

Différentes options sont fournies concernant les données aberrantes que l’on peut soit supprimer, soit « normaliser », soit remplacer par une valeur moyenne ou NULL :

              ExploDonnées11

Autre outil fort utile l’assistant permettant de ré-étiqueter les données pour que le jeu de données soit le plus cohérent possible :

              ExploDonnées12

Patrick Guimonet - System Engineer Senior - IT PRO, Microsoft