En octobre dernier, j’ai eu l’occasion de montrer comment analyser des données venant de logs Web et Twitter avec PIG et HIVE dans Hadoop, puis de croiser les résultats dans Excel, ce qui permet de décliner le résultat dans Power BI.

Je mets ici les diapos et les vidéos (les vidéos sont les vidéos de secours que j’avais, et non la présentation live qui a été faite, mais c’est évidemment très proche).

Cela permet d’avoir une première vision rapide de ce qu’on peut faire avec un cluster HDInsight. C’est un moyen très abordable (autant en termes financiers que technique) de démarrer avec Hadoop.

Les diapos complètes sont disponibles sur OneDrive.

La problématique:
image

Si vous voulez tester par vous-même, vous pouvez aller à http://aka.ms/tester-mon-azure où vous aurez 150 € de ressources Windows Azure pour tester pendant 1 mois.

Voici les vidéos:

Présentation des données

Création du cluster
Jobs PIG et Hive
Excel et suite de l’exécution des jobs
Suppression du cluster

Smile

Benjamin (@benjguin)