Thursday, June 05, 2008 3:44 PM
philipbl
L’exploration de données comment faire ? (3/3)
Nous avons vu dans le billet précédent comment préparer ses données pour que la modélisation soit la plus pertinente possible. Passons à la modélisation proprement. Nous avons accès à 5 algorithmes (plus un mode avancé).
Utilisons par exemple, l’algorithme de classification sur un fichier de clients ayant ou non acheté un vélo dans un magasin (physique ou en ligne).
L’écran principal de l’assistant nous permet d’indiquer les données à analyser (ici la décision d’achat d’un vélo) et les données à utiliser pour modéliser cet acte d’achat.
En retour de la phase de modélisation, l’assistant nous ouvre un affichage permettant de visualiser très clairement les critères d’achat les plus importants. Ici : l’âge

Puis la distance au lieu de travail :
Enfin l’arbre de décision permet de classifier l’ensemble de la population de manière précise. L’on constate ici que la population âgée de moins de 39 ans et dont la distance au lieu de travail et comprise entre 2 et 4 km est très largement acheteuse de vélos (264 achats sur 468). Cette connaissance permettra de définir, par exemple, des promotions adaptées.
Enfin on sera capable de comparer cette modélisation par rapport à une autre en utilisant le graphe de précision ci-dessous.

Patrick Guimonet - System Engineer Senior - IT PRO, Microsoft