Nous avons vu dans le billet précédent comment préparer ses données pour que la modélisation soit la plus pertinente possible. Passons à la modélisation proprement. Nous avons accès à 5 algorithmes (plus un mode avancé).

ExploDonnées13  

Utilisons par exemple, l’algorithme de classification sur un fichier de clients ayant ou non acheté un vélo dans un magasin (physique ou en ligne).

L’écran principal de l’assistant nous permet d’indiquer les données à analyser (ici la décision d’achat d’un vélo) et les données à utiliser pour modéliser cet acte d’achat.

         ExploDonnées14

En retour de la phase de modélisation, l’assistant nous ouvre un affichage permettant de visualiser très clairement les critères d’achat les plus importants. Ici : l’âge

                          ExploDonnées15

Puis la distance au lieu de travail :

                          ExploDonnées16

Enfin l’arbre de décision permet de classifier l’ensemble de la population de manière précise. L’on constate ici que la population âgée de moins de 39 ans et dont la distance au lieu de travail et comprise entre 2 et 4 km est très largement acheteuse de vélos (264 achats sur 468). Cette connaissance permettra de définir, par exemple, des promotions adaptées.

ExploDonnées17

Enfin on sera capable de comparer cette modélisation par rapport à une autre en utilisant le graphe de précision ci-dessous.

ExploDonnées18

 

Patrick Guimonet - System Engineer Senior - IT PRO, Microsoft