La visualisation de données #datawiz est une constituante importante de l’Open Data pour « faire jaillir » l’information. Un précédent billet s’intéressait à ce propos à l’extension DataExplorer pour Microsoft Excel 2013. Histoire d’aller encore un peu plus loin, nous abordons dans ce billet une autre extension de Microsoft Excel 2013, à savoir « GeoFlow ».

« GeoFlow » (nom de code du projet) est une nouvelle extension de visualisation de données en 3D et de narration qui fournit une méthode puissante simple d’appréhension pour afficher, explorer et interagir avec des données géographiques et le cas échéant également chronologiques (temporelles), permettant des découvertes dans les données qui pourraient être difficiles à identifier dans les tableaux 2D traditionnels et les graphiques. Avec « Geoflow », vous pouvez tracer jusqu'à un million de lignes de données en 3D sur une carte Bing Maps, voir comment les données évoluent dans le temps et partager avec d’autres vos découvertes à travers de belles captures d'écran et des visites guidées cinématographiques.

Pour de plus amples informations sur « GeoFlow », nous vous invitons à consulter la page Facebook dédié : https://www.facebook.com/GeoFlowForExcel.

Vous pouvez télécharger l’extension « GeoFlow » depuis le Centre de téléchargement Microsoft ici. Téléchargez le fichier GeoFlow Preview For Excel 2013.exe et exécutez ce dernier. Il ne vous reste plus qu’à suivre les instructions de l’assistant d’installation.

Une fois l’extension installée, vous accédez aux fonctionnalités de « GeoFlow » au sein de Microsoft Excel 2013 depuis l’onglet INSERT du Ruban Office via le bouton Maps du groupe de commande GeoFlow.

image

Les « présentations » étant ainsi faites, ce billet se propose de repartir là où le précédent billet vous a « laissé ». Ce billet constitue en quelques sortes une seconde partie.

Ainsi, vous avez agrégé par le biais de l’extension Data Explorer, sur le thème « les communes françaises », différentes sources de données, à savoir des données provenant d’un flux OData (via la plateforme de publication de données ouvertes OGDI DataLab) et des données complémentaires provenant directement d’Internet. PowerView vous a ensuite permis de visualiser les données résultantes sous forme de diagrammes 2D affichés sur un tableau de bord.

Nous allons nous intéresser ici à la visualisation en 3D de ces données sur une carte géographique. Pour cela, notre jeu de données doit posséder des données localisées (avec des coordonnées géographiques, une adresse, un nom de ville). Ça tombe bien : notre analyse précédente portait sur le nombre d’habitants de chaque département français. Qui dit département, dit aussi coordonnées spatiales.

C’est parti !!

Etape 1 : Prise en main de « GeoFlow »

Commencez par télécharger le fichier Data_Explorer.xlsx issu du tutoriel précédent proposé (également) en pièce jointe de ce billet. (Allez pour cela tout en bas du billet), ou si vous préférez, suivez les étapes de celui-ci jusqu’à l’étape 3 au minimum.

Ouvrez le fichier Data_Explorer.xlsx dans Microsoft Excel 2013, puis sélectionnez la feuille de calcul nommée Final. Pour ce faire, cliquez sur l’onglet nommé Final en bas de l’interface d’Excel.

clip_image002

Cette feuille représente le tableau résultant de la commande Merge de DataExplorer. Comme mentionné ci-avant, cette commande a été appliquée à deux sources de données, la première venant de l’instance de test OGDI DataLab mise à disposition par Microsoft France ici, avec des informations sur les 36 000 communes de France, et la seconde en provenance de Wikipédia proposant la liste des départements français avec leur nom, la région associée, et le numéro.

Sélectionnez l’onglet INSERT du Ruban Office et cliquez sur le bouton Map du groupe de commande GeoFlow.

clip_image004

Un menu s’affiche.

clip_image006

Cliquez sur Launch GeoFlow. Une boîte de dialogue s’ouvre, cliquez sur + New Tour.

clip_image008

Une nouvelle fenêtre s’ouvre alors, chargeant automatiquement les données en provenance de la feuille Excel courante dans le moteur de requête « GeoFlow ». Vous devez obtenir le résultat suivant :

clip_image010

Comme vous pouvez le constater, l'interface est relativement épurée avec un Ruban Office, un globe au centre sur lequel seront affichés nos diagrammes plus tard et deux panneaux Tour Editor et Task Panel de part et d’autre de la carte.

Pour continuer votre « petit tour du propriétaire », le Ruban Office propose les commandes suivantes :

  • Themes : Changement du thème de la carte (en mode foncé, en mode photographie spatiale, etc.).
  • Map Labels : Activation de l’affichage des noms des villes sur la carte.
  • Data Shape : Ajout de formes (rond, carré, etc.) personnalisées.
  • Add Scene : Ajout d’une nouvelle séquence animée (visible dans le panneau Tour Editor à gauche).
  • Play Tour : Déroulement de l’enchainement de toutes les séquences animées, avec les transitions entre chacune d’elles.
  • Chart : Ajout par-dessus la carte d’un diagramme Excel, utilisant les données de la colonne sélectionnée dans le panneau de droite.
  • Show All Legends : (Ré)affiche des légendes supprimées de la carte.
  • TextBox : Ajout par-dessus le diagramme d’une étiquette à l’endroit voulu.
  • Tour Editor : Affiche le panneau éponyme à gauche.
  • Task Panel : Affiche le panneau éponyme à droite.
  • Add Layer : Ajout d’un calque graphique (visible et paramétrable dans le panneau Task Panel) avec laquelle nous allons pouvoir afficher nos données de la façon souhaitée.
  • Find Location : Recherche sur la carte d’une adresse en utilisant l’API Bing Map.
  • Copy Screen : Prise d’une capture d’écran de la partie centrale qui sera mise dans le presse-papiers.

Pour les besoins du tutoriel, nous nous positionnons sur la France à l’aide des boutons de navigation.

clip_image012

Etape 2 : Filtrage des données

Commençons maintenant par choisir ce que nous voulons afficher sur la carte comme information.

Nous vous proposons de mettre en évidence pour les besoins de ce tutoriel le nombre d’habitant que possède chaque département français. Pourquoi avoir choisi l’échelle du département ? Elle n’est dans la pratique ni trop grande et ni trop petite, un juste milieu pour afficher la carte de France avec un seuil acceptable en terme de nombre de données affichées et suffisamment synthétiques.

Les colonnes de notre tableau Excel qui vont vous intéresser sont donc le département (colonne NewColumn.Departement) et la population (colonne popu) qui est exprimée par unité de cent.

Dans le panneau Task Panel à droite, vous devez voir une liste défilante placée sur le seul élément présent Layer 1.

En dessous, sont listés les colonnes existantes dans le tableau nommé Table21 (qui provient de la feuille Excel). Au sein de cette liste, choisissez NewColumn.Departement, puis dessous dans la zone GEOGRAPHY, déroulez la liste en lien avec la colonne et sélectionnez State/Province.

Cliquez sur Map It.

clip_image014

« GeoFlow » se charge alors de géo-localiser les informations de notre jeu de données en utilisant le service Bing Map. Ce dernier agrège les informations par départements (c’est à dire les regroupe ensemble). Tout ceci est transparent. Apparaissent alors des carrés rouges sur la carte de France à chaque emplacement de département. Vous pouvez parcourir la documentation de notre jeu de données qui est fourni par le Répertoire Géographique des Communes (RGC) ici.

clip_image016

Vous en avez presque fini :) Il ne reste plus qu’à spécifier ce que nous voulons comme donnée(s) à afficher par département. Sélectionnez pour cela dans la liste l’élément popu.

clip_image018

En dessous, dans la section Char Type, vous pouvez choisir quel type de diagramme utiliser. Le type par défaut est histogramme (Column). Choisissez pour cette catégorie de donnée HeatMap. Vous obtenez le résultat suivant.

clip_image020

Rendez-vous dans la fenêtre de paramétrage du calque (Layer). Cliquez sur l’icôneclip_image022 (dans le panneau Task Panel à droite).

clip_image024

Dans Layer Name, remplacez la valeur par défaut par « Habitants par département ». Ce texte s’affiche alors dans la légende de la carte.

Réglez la valeur de Color Scale dans Size à 160%. Réglez la valeur de Radius of Influence à 250%.

Le résultat final est le suivant :

clip_image026

Aller plus loin

Il est possible de définir une nouvelle colonne dans notre tableau Excel représentant la densité de population. Celle-ci est facile à calculer avec Excel car elle est le simple résultat de la division entre nombre d’habitants et la surface :

popu / surface * 10^4

Notez au passage que la multiplication par dix puissance quatre est nécessaire pour retrouver un résultat en habitants/km² (La surface est exprimée en hectare et la population par centaine d’habitants).

Vous pouvez ensuite ajouter un second calque pour représenter cette densité. La capture ci-dessous présente le résultat :

clip_image028

Les zones de chaleur représentent la densité d’habitants tandis que l’histogramme représente la population cumulée pour un département. Cette carte décrit avec plus de précision que la précédente la répartition des hommes sur le territoire français. On peut constater par exemple que le département des Bouches du Rhône a une densité faible malgré un grand nombre d’habitant cumulé (principalement grâce à la ville de Marseille).

Ceci conclut ce billet à la découverte de « GeoFlow ». Nous n’avons qu’effleuré le champ des possibles.

Si la visite vous a plu, voici quelques liens complémentaires pour poursuivre votre exploration :