Nous vous proposons de découvrir dans ce billet un guide « vademecum » pour mener à bien un projet Open Data.

image

Rédigé par Microsoft, il fait partie d’un ouvrage dédié à l’Open Data coordonné par le Réseau des Territoires Innovants et sera diffusé début janvier 2013, suite au Forum annuel des INTERCOnnectés les 3/4 décembre 2012 : Inscription et Programme.

image

 

Le “mouvement de libération des données publiques” au bénéfice des citoyens, plus communément appelé « Open data », est en marche dans de nombreux pays.

En plus de participer activement à la modernisation des administrations qui les mettent en œuvre et de permettre l’optimisation de la dépense publique, les projets Open data constituent une opportunité d’innovations démocratiques, sociales et économiques inédites.

  • Innovations démocratiques, car ils facilitent l’information des citoyens, une meilleure compréhension des politiques publiques, contribuant ainsi à une plus grande implication de chacun.
  • Innovations sociales, car ils fluidifient la communication entre les différents acteurs et favorisent l’émergence de dispositifs innovants grâce à une appréhension plus fine des besoins.
  • Innovations économiques, car ils accélèrent l’émulation entrepreneuriale dans les écosystèmes au cœur des territoires et la création d’applications nouvelles.

La garantie d’un meilleur service aux citoyens

La mise en place d’un projet Open Data représente un nouveau moyen pour l’Etat et les collectivités de répondre aux attentes des administrés et aux besoins de développement des acteurs économiques locaux. Il initie une importante avancée démocratique en mettant en avant la transparence de l’action publique et favorise une plus grande participation des citoyens à la vie politique. Il génère de nouveaux services destinés aux administrés pour les assister dans la vie de tous les jours et il permet à des start-up, des PME, des entrepreneurs de toutes tailles, de créer des applications originales permettant à un écosystème créateur d’emplois locaux d’émerger.

Si un projet Open data est simple techniquement, il est facteur de transformation de l’organisation. L’adhésion des élus et des agents publics est déterminante. Ceux-ci y trouveront un gisement de motivation et de satisfaction tant l’Open data leur donne un accès simplifié aux données dont ils ont besoin pour piloter la collectivité ou mener à bien leurs missions quotidiennes.

L’ouverture est essentielle à la réussite de ce projet. Elle concerne tout autant les données, qui doivent impérativement être publiées dans des formats ouverts et interopérables, que les technologies utilisées afin de garantir l’accès à ces données, que la collaboration au sein des organisations pour sélectionner les données et accélérer la mise en place de services innovants.

Des bonnes pratiques fondées sur l’expérimentation

Microsoft a eu l’honneur d’accompagner des initiatives ambitieuses comme celles du Conseil général de Saône et Loire, de Bouches-du-Rhône Tourisme, de la ville de Versailles et de Versailles Grand Parc, nous permettant aujourd’hui de témoigner des facteurs clefs de succès et d’établir des recommandations pour ceux qui souhaitent se lancer dans un tel projet.

Nous nous proposons ainsi de dresser un panorama de bonnes pratiques en nous concentrant d’abord sur la problématique des données, leur sélection et leur mise à disposition pour exploitation, pour ensuite aborder les bénéfices pour le fonctionnement de la collectivité. Nous espérons ainsi contribuer à faciliter la mise en place de projets Open data et démontrer tout le potentiel qu’ils représentent pour la transformation de l’Etat et des collectivités.

Trois étapes pour réussir votre projet Open data

La réussite d’un projet Open data tient à l’usage que feront les citoyens et les développeurs des données publiées : la consultation des données par le citoyen, leur réutilisation et la création de nouveaux services par des développeurs et des entreprises, et enfin la génération de phénomènes de co-production par tous. Toutes les étapes du projet doivent donc se dérouler en fonction de l’objectif d’usage.

Nous vous conseillons trois étapes :

  1. Inventorier, sélectionner et s’assurer de la qualité des données ;
  2. Créer et publier un catalogue pratique et facile d’accès ;
  3. Promouvoir le projet pour en amorcer l’utilisation et la co-production.

Chaque étape a ses bonnes pratiques à suivre.

Première priorité : la qualité des données

Répertorier les données

La première étape consiste à répertorier l’ensemble des données produites par l’organisation afin de sélectionner celles qui seront publiées. C’est la phase la plus longue d’un projet Open Data. L’inventaire doit être aussi exhaustif que possible, pour connaître toutes les données produites et évaluer leur qualité, non pas en terme de potentiel d’utilisation, toujours difficile à estimer à l’avance, mais en fonction de critères de récence, de densité et de granularité.

Un jeu de données est pertinent :

  • Si on n’observe pas de lacune dans ses colonnes, comme des coordonnées géographiques manquantes dans un fichier d’accidentologie ;
  • S’il présente une granularité suffisante (par exemple, pour de la consommation d’énergie, des données par minute sont plus pertinentes que des données mensuelles) ;
  • Si le format des données est fiable avec le même référentiel pour tous, comme un nommage de colonne uniforme pour le terme « arrondissement » versus « arrdt » ou « arr », etc.

Seul un jeu de données complet, parfaitement formaté et dont la mise à jour sera assurée, doit être éligible à la publication, sous peine de rendre les données largement inutilisables et donc inutiles, et de déclencher la déception des citoyens.

Citons comme exemple un service faisant de la pédagogie sur les risques routiers et montrant ainsi les passages à niveau où les accidents sont les plus nombreux. Ce service résulte d’un croisement de données entre un fichier d’accidentologie fourni par l’Etat et la cartographie SNCF des passages à niveau. Il ne sera utilisable que si le fichier est complet, utilisant les mêmes référentiels géographiques.

Mobiliser les utilisateurs

Il est parfois difficile de se rendre compte a priori de la validité des jeux de données car ceux-ci peuvent comporter des centaines de milliers d’information. C’est par la restitution sous forme de cartographies ou de graphiques que seront mises en évidence les erreurs.

Une phase de test et de mobilisation des utilisateurs peut se révéler très utile, en leur permettant de contribuer à leur tour à la qualification des jeux de données en envoyant leurs propres données. Par exemple, des restaurateurs feront parvenir leurs horaires d’ouverture si la donnée n’est pas à jour et apporteront également des informations complémentaires concernant leur commerce (type de menus, échelle de prix, nombre de places, accessibilité, etc.).

Par le recensement complet des données, l’organisation entre en possession d’une nouvelle matière à forte valeur pour optimiser sa gestion. Certaines données ne correspondront pas en effet au projet Open data mais elles viendront approvisionner des tableaux de bord pour aider la collectivité à faire ses choix stratégiques de pilotage.

Quel cadre juridique ?

Une fois les jeux de données reconnus comme éligibles, la sélection se fait sur des critères légaux puis politiques. Même s’il n’existe pas de loi ad hoc concernant l’Open data, la loi de référence est celle relative à la liberté d’accès aux documents administratifs et à la réutilisation des informations publiques, du 17 juillet 1978. Elle énonce que les données nominatives, personnelles, sensibles (de sécurité nationale par exemple) ou encore les données de tiers ne sont pas publiables. Néanmoins, les données nominatives peuvent être rendues anonymes. A cet égard, il importe d’être également vigilant quant au respect de la vie privée et des données personnelles et donc de se rapprocher de la CNIL en cas d’hésitation sur l’application de la loi « Informatique et libertés ».

Libérer le potentiel de l’Open data

Il revient ensuite à un comité de faire un choix éditorial sur les données publiables. Nous recommandons d’impliquer dans ce comité des profils variés, décideurs/responsables de communication/agents métiers pour s’assurer d’un maximum de diversité de sujets et de garantir la pertinence de la sélection.

Pour libérer tout le potentiel de l’Open data en termes d’innovation, de transparence démocratique et d’innovation économique et sociale, il est préférable de publier le plus grand nombre de données possible. Le principe même de l’innovation repose sur des idées nouvelles, pas encore imaginées. Il ne faut donc pas se limiter en pensant que la donnée n’est pas pertinente, seuls les citoyens et développeurs jugeront de son intérêt en fonction de leurs usages ou de leurs idées de services innovants.

Aujourd’hui les différentes démarches Open data réalisées en France concernent principalement les données relatives au patrimoine culturel, aux infrastructures publiques, aux transports, à l’environnement, les données sociodémographiques et, dans une moindre mesure, aux finances publiques.

L’étape de sélection passée, il est recommandé de diffuser les différents jeux de données au fur et à mesure car il est important de répondre rapidement aux besoins des citoyens et fournir un premier service de qualité même si le nombre de thématiques est restreint. Cette approche par étape permet de gérer efficacement les ressources nécessaires à la qualification des données mais également de tirer profit des retours d’expérience des utilisateurs.

Une plateforme simple et peu coûteuse, c’est possible

La deuxième étape d’un projet Open data correspond à la création d’un catalogue de données facilement exploitables techniquement par les développeurs, c’est-à-dire les rendre automatiquement traitables par l’informatique, quels que soient les choix technologiques des utilisateurs.

Privilégier le flux de données

Il s’agit d’abord de choisir le bon format de publication des données pour permettre de les traduire en information ou en service, par exemple la consultation d’un horaire de transport en temps réel. Nous recommandons la publication sous forme de flux de données, les formats « fichier » permettant difficilement d’effectuer ce type de requêtes

Ensuite, la plateforme de publication doit garantir l’interopérabilité et s’appuyer sur les standards du web afin d’en garantir l’accessibilité pour tous. Microsoft répond par exemple à cette exigence d’interopérabilité en adoptant le protocole ouvert de données OData (Open Data Protocol). Les spécifications de ce protocole sont ouvertes, publiques et libres d’implémentation.

Le « nuage » évite les contraintes d’infrastructures.

Enfin la plateforme technique doit être capable d’héberger un nombre croissant de données et d’applications, de gérer les pics de montée en charge, tout en maîtrisant la dépense associée.

Le Cloud, «  informatique en nuage », s’impose ainsi progressivement comme un partenaire naturel de l’Open data. Il offre la possibilité d’héberger des données en adaptant la capacité de stockage et de traitement en fonction des besoins de la collectivité, en gérant les pics et les creux sans affecter par ailleurs le système d’information de la collectivité. Par exemple, diffuser des informations et des images liées à un événement culturel pourra entraîner un pic de trafic très fort juste avant et après l’événement, qu’il faut pouvoir absorber sans pour autant revoir toute l’infrastructure. Le « Cloud » répond à ce besoin en libérant l’organisation publique des contraintes de coût des infrastructures.

La collectivité n’a pas à effectuer des investissements coûteux dans des serveurs et dans la mobilisation de ressources compétentes pour en assurer la maintenance : le « Cloud » introduit un paiement à l’usage. Chris Moore, directeur des systèmes d’information d’Edmonton au Canada, précise ce bénéfice : « Notre métier n’est pas de faire de l’informatique, encore moins de la maintenance de serveurs, mais de proposer de meilleurs services aux citoyens » (Cf. interview publiée dans Regards sur le numérique, le laboratoire d’idées de Microsoft France. A lire sur www.RSLNmag.fr dans le dossier Open data, et nous, et nous, et nous).

Edmonton a ainsi choisi d’héberger les données et les applications hors des serveurs de la ville, en s’appuyant sur les technologies du « Cloud ». La simplicité du « Cloud » a aussi permis à la ville de publier ses premiers jeux de données en seulement trois semaines.

En France, le conseil général de Saône et Loire, Bouches-du-Rhône Tourisme et la ville de Versailles font figure d’exemples : ils ont choisi une solution fonctionnant dans le Cloud, prête à l’usage, ouverte et évolutive, disponible sous licence libre.

Une interface intuitive et facile d’accès

Autre volet essentiel de la plateforme : l’interface de visualisation, qui mettra en scène les données, les transformant en des informations facilement consommables par le citoyen.

Une série de données de localisation des arrêts de bus prendra d’autant plus de sens pour l’utilisateur qu’elle sera représentée sur une carte géographique. Le visualisateur peut aussi croiser plusieurs jeux de données et générer alors de nouveaux services, accessibles depuis un ordinateur, un smartphone ou une tablette. Par exemple, le site Internet Cycle Streets au Royaume-Uni croise des informations de localisation des pistes cyclables, des feux tricolores ou encore des intersections routières avec une base de données recensant la localisation des accidents de personnes en vélo afin d’offrir un service de planification d’itinéraire de trajet pour cyclistes en fonction du degré de sécurité.

Ces visualisateurs sont nécessaires aux citoyens et garantissent la valeur d’usage des données.

La promotion du projet, gage de sa réussite

La dernière étape à franchir est celle de la promotion du projet. Tout le travail de recherche, de qualification et de tri des données n’aura de valeur que si les développeurs d’applications informatiques s’en emparent.

Créer une dynamique de collaboration et de co-production avec la communauté d’utilisateurs permet d’imaginer de nouveaux services, à communiquer ensuite aux citoyens.

Comme déjà exprimé plus haut, la consultation des données est favorisée par un outil de visualisation. En parallèle du travail de sélection des données, une collectivité peut contacter les développeurs pour initier les premiers services en faisant un appel à projets ou en organisant un concours d’applications, moyen rapide de créer une émulation au sein de l’écosystème.

Accompagner les citoyens de la consultation à la creation

Le premier concours d’ampleur, organisé en 2007 par la ville de Washington, a vu la création de 47 applications développées en 30 jours. L’engouement ne se dément pas non plus en France. Le concours lancé par Rennes Métropole en octobre 2010 a donné naissance à 43 applications. Il est recommandé, à l’image de ce qui a été fait à Rennes ou encore par le CG 71, de proposer des catégories - telles que transport, accessibilité, développement durable, tourisme - afin de garantir un développement d’applications pour toutes les thématiques de données que l’organisation prévoit de publier.

La promotion du projet est l’occasion d’impliquer diverses parties prenantes : chercheurs, grandes entreprises, CCI, associations, mouvements citoyens etc. Les acteurs économiques d’un territoire sont même des partenaires naturels car l’Open data est un vecteur de valorisation du territoire. La CCI Marseille Provence l’a compris qui a ainsi mis en place un concours à l’occasion de l’événement « 2013, Capitale Européenne de la Culture » afin de récompenser les applications les plus innovantes utilisant les données libérées par les portails Open data de la Région Provence-Alpes-Côte d’Azur et de Bouches-du-Rhône Tourisme.

Faire remonter les remarques

Un autre facteur de succès d’une démarche Open data réside dans la création d’échanges permanents entre la collectivité et l’écosystème. Nous préconisons ainsi la mise en place d’une interface sur le portail Open data permettant aux utilisateurs de faire remonter leur remarques à la collectivité concernant la qualité des données ou des suggestions sur la publication de nouvelles données.

La collectivité doit également favoriser une dynamique de co-production alimentée par les acteurs eux-mêmes. Ainsi, elle peut mettre en place des éléments de réseaux sociaux pour que chacun puisse partager des idées d’usage et d’application, des conseils ou bonnes pratiques entre différentes compétences (l’initiateur d’une idée, un développeur, un graphiste).

L’Open data modernise les organisations

Au-delà des bonnes pratiques recensées sur l’établissement d’un projet Open data, notre expérience auprès d’organisations publiques en France, et à travers le monde, nous a convaincus que la démarche Open Data est un formidable vecteur de modernisation des organisations.

Elle favorise une collaboration nouvelle entre les services, crée un processus unifié de production de données de qualité et fournit des informations nouvelles et critiques pour optimiser la gestion de l’organisation.

De par sa nature transversale, un projet Open data fédère les différents acteurs de l’organisation. Il aura d’autant plus de retombées qu’il aura été piloté par un comité rassemblant des expertises complémentaires. Il doit d’abord être porté par l’élu afin d’initier la dynamique collaborative et s’assurer de la promotion auprès des citoyens. Il doit ensuite représenter les directions de services afin d’avoir la vision la plus exhaustive des données et confirmer l’ambition sur le long terme.

Cette collaboration nouvelle va également permettre de faire connaître, partager et réutiliser les informations produites entre les services et les aider à être plus efficients dans la mission de service public.

De plus, le recensement des données conduit à la mise en œuvre d’une unification de la chaîne de production et d’un système de flux simplifié. Pour exemple, les problématiques de nommage des arrondissements citées précédemment. Suite à un projet Open data, certaines collectivités ont mis en place des processus de qualité afin d’améliorer les procédures de production et de partage des données et ont décidé d’allouer une ressource spécifique pour assurer la cohérence des données métiers.

Par ailleurs, la création d’une interface unique d’accès à l’ensemble des données favorise le développement de nouveaux outils internes, notamment de gestion, auxquels tous les agents vont pouvoir se référer. Ce peut être l’interface de visualisation destinée à l’origine aux citoyens. Ainsi, les agents du CG 71 ayant rapidement adopté le portail public pour consulter les informations relatives à l’évolution des budgets, des dettes ou encore des montants des subventions allouées ; les responsables du projet Open data ont créé un tableau de bord de pilotage exclusivement à usage interne. Cela représente aussi une optimisation financière pour mettre en place rapidement un outil de gestion à moindre coût.

Les nombreux bénéfices liés à la mise en œuvre de l’Open data seront multipliés si les projets sont menés au niveau territorial. Ils apporteront un enrichissement des données, une mutualisation des ressources, un partage des bonnes pratiques, et l’amélioration de la gestion publique à plus grande échelle.

Cette dynamique, qui s’inscrit parfaitement dans le cadre de la loi de réforme des collectivités territoriales, est d’ores et déjà en marche au travers de projets menés par Nantes Métropole et Versailles Grand Parc. Et pourquoi pas, demain, dans votre collectivité ?