Le catalogue attendu depuis longtemps des données publiques du gouvernement américain a été lancé jeudi dernier sous l’url data.gov. Les développeurs, analystes politiques et partisans de l’eDemocratie se réjouissent de par le monde, mais l’offre initiale en contenus sucite des réactions mitigées.
Vivek Kundra, le tout nouveau CIO du gouvernement (un poste à ne surtout pas confondre avec celui de NKM), est en charge du site, qui aura pour rôle d’être un répertoire centralisé pour les données gouvernementales en libre accès utilisant les formats XML, CSV, KML et bien d’autres. A l’heure du lancement, 47 groupes de données sont disponibles, et il semble que ceux-ci ait été choisies pour leur capacité à ne pas susciter de controverses.
Cela n’en est pas moins une date historique, et ce n’est probablement qu’un début. Il y a fort à parier que des mashups fort intéressantes verront le jour sous peu.

Marshall Kirkpatrick de ReadWriteWeb US ne cache pas sa frustration au sujet de la faiblesse de l’offre en matière de données :
“Il existe beaucoup plus de données gouvernementales disponibles, ailleurs que sur data.gov, mais l’administration Obama dit avoir sélectionné celle-ci sur des critères de qualité et de respect des standards. Difficile, cependant, de ne pas être un peu déçu quand on compare l’offre à ce qui est disponible sur des sites construits autour d’initiatives privées comme USGovXML.com, qui a été construit en quatre mois à peine.
26 agences gouvernementales fournissent des données à travers data.gov, mais toutes n’offrent pas des données brutes. Le FBI par exemple, se contente de proposer un widget à placer sur des sites tiers et ne donne pas accès aux données de base.”
Derek Willis du New York Times souligne que les données fournie ne sont en aucune façon sujette à aborder des sujet qui prêtent à controverse :
“La plupart sont issues de l’USGC, de l’EPA et de la météorologie nationale”, “aucune données en provenance du Department of Homeland Security (l’équivalent, grosso modo du ministère de l’intérieur Français), de l’Etat ou de Ministère de la justice”. Dans un billet publié au lendemain du lancement de data.gov, il se montre particulièrement critique à son sujet.
(disclaimer : ReadWriteWeb est partenaire du New York times dont il alimente en contenus les pages Technologie)
Pour aller dans son sens, une recherche au sein des données fournies sur des mots comme alimentation, prison, ou drogue ne donnent aucun résultat. Ces sujets sont pourtant d’une importance capitale car elles sont au coeur de débats critiques pour la justice. Apporter un éclairage nouveau à travers cette ouverture des données sur de tels sujets permettrait de faire avancer les débats en dehors de tout parti pris idéologique.
Il n’existe aucun flux RSS disponible pour les groupe de données ou pour les recherches faites sur celles ci, ce qui serait capital pour rester alerté sur l’avancée et la constitution du catalogue, mais cela sera vraisemblablement ajouté sous peu.
On pourra toujours affirmer que quelques données est préférable à pas de données du tout, mais on ne peut s’empécher d’être quelque peu décu.
Pour donner un point de vue plus optimiste et enthousiaste, on se réfèrera à John Musser de ProgammableWeb, qui écrit à ce sujet :
« C’est un départ très prometteur. Un grand pas vers l’accessibilité des données gouvernementales. Nous voyons en moment les même efforts faits dans la première version de l’accès aux votes du sénat : la première étape consiste à donner accès à des données structurées comme le XML, la suite consistera à les rendre accessibles via une API. Ils disposent d’une énorme quantité de métadonnées. Pour l’instant, le nombre de set de données n’est pas énorme, mais c’est un début”
De son coté, O’Reilly a dors et déjà lancé un concours de mashup construites sur ces données et tout le monde attends avec impatience de voir comment ces nouvelles applications vont pouvoir faire avancer la démocratie américaine.
Le gouvernement Américain a par ailleurs lancé sur le site de la maison blanche une page donnant accès à toutes les initiatives du gouvernement en la matière. Cela donne un aperçu de la multitude des initiatives de l’administration Obama en la matière et à la diversité des initiatives. A rapprocher des initiatives à venir en France en la matière.
En France, il n’est à ce jour pas question de donner accès au public aux données de l’état, les programme concernant l’eDemocratie se limitant en réalité à de l’eAdministration, fournissant un service aux administrés mais en aucun cas des données publiques aux citoyens.
A défaut d’annonce du gouvernement, il y a fort à parier que cette ouverture des données soit imposée par des initiatives citoyennes, mais il leur faudra pour cela coordonner bien des initiatives pour en faire un tout cohérent, à commencer par la collecte de données, une initiative déja largement prise en charge par La Quadrature du Net, auquel il faudra ajouter la mise à disposition de ces données dans un format d’échange, voir des API, sans oublier les passerelless à établir entre de multiples sources certes publiques mais non structurées qu’il conviendra de transformer en données structurée. Une initiative similaire a SunlightLabs http://www.sunlightlabs.com/about/ devrait voir le jour sous peu en France afin de faire avancer les choses et de construire un cadre technique et méthodologique avec les différents acteurs intéressés par le projet.
A lire également :
- Crowdsourcer Data.gov avec TransparencyCorps ...
- Skype disponible sur l’iPhone est bien parti pour être un géant des Telco du XXIe siècle ...
- Socialmedian ajoute un flux d’information, comme Friendfeed mais sans le bruit ...
- Data.gov a de la concurrence ...
- Data mining sur Facebook : ça fait peur ...
- Les ados ne sont pas sur Twitter, mais cela ne saurait tarder ...











25 mai 2009 à 9:06
Bravo
Bonne analyse qui est corroboré par des sources du groupe d interet W3C eGovernment intrest group.
Il y a encore du chemin à faire
Je pense aussi que des flux RSS personnalisables basées sur une recherche ( un peu à la mode Gallica 2 ) seraient très utiles.
Bien à vous
Votre papier existe-t-il aussi en anglais ?
25 mai 2009 à 13:26
En France, il n’est à ce jour pas question de donner accès au public aux données de l’état, les programme concernant l’eDemocratie se limitant en réalité à de l’eAdministration, fournissant un service aux administrés mais en aucun cas des données publiques aux citoyens.
hmm…
d’abord, les USA sont le pays où la statistique publique est la plus éclatée. il y a plus de 100 agences qui produisent des données officielles… or dans la quasi totalité des pays développés il y a une seule agence (chez nous, l’insee) qui emet la quasi-totalité des données.
il y a 2 ans, la France a lancé “statistique publique”, un portail/catalogue/point d’accès pour tout le reste.
tout ça pour dire qu’en la matière, les USA ne sont pas en avance mais plutôt sacrément à la traîne.
maintenant sur la gratuité des données, il y a énormément de données officielles gratuites en France, le reste est à la charge des utilisateurs qui en ont besoin. l’alternative, c’est de les faire payer aux contribuables.un système où les statistiques publiques sont gratuites ne peut pas exister.
25 mai 2009 à 13:45
@jacques
oui, c’est ici : http://www.readwriteweb.com/archives/datagov_finally_launches_looks_nice_but_short_on_d.php
@jerome
L’enjeux n’est pas tant, à mon sens, dans la mise à disposition de statistiques publiques, mais dans la mise à disposition d’informations concernant la vie démocratique quotidienne d’une nation, tel que les votes des parlementaires, par exemple, ou pire, comme on peut le trouver en Suède, leurs notes de frais ;-)
26 mai 2009 à 7:23
@Fabrice : A la réflexion, je pense que une période de test (pendant laquelle peut de données seraient releasées, et seulement des données non dangereuses) aurait été utilisées dans de nombreux pays. Ce qui est important, c’est de voir cette période rapidement arriver à son terme, et l’ensemble des données gouvernementales vraiment être publiées.
@jerome : Je crois que la différence de l’initiative américaine avec l’INSEE française, c’est qu’en France, l’INSEE a les données et publie leur interprétation. Aux USA, ce sont les données brutes qui sont publiées. Chaque citoyen peut ensuite en faire ce qu’il veut. Et c’est cela qui est important.
26 mai 2009 à 8:16
Bonjour,
Ne serait-il pas intéressant de développer un site qui regroupe les quelques données officielles ?
Finalement sur les différents sites des ministères du gouvernement français, on trouve beaucoup d’information. Le problème est que l’on ne trouve que trop souvent les dernières statistiques en date. Ce qui est intéressant c’est de voir les évolution, de pouvoir rapidement croiser les données. C’est de cette façon que l’on peut faire émerger des tendances et des corrélations.
Le site http://www.statistique-publique.fr me parait tout à fait exploitable mais non optimal. En effet, il n’offre que des liens vers des pages ou des fichiers contenant, sur les différents sites des ministères, l’information officielle.
Pour ce qui est de http://www.data.gov, je ne suis pas encore convaincu. Le simple fait qu’il y ait toutes ces agences qui comptabilise me donne déjà le tournis. De plus sortir un site sans contenu alors que son unique emploi est simplifié l’accès à ce dit contenu, c’est un peu étrange. Uniquement 5 catégories sur 14 ont des data accessibles… Je reste perplexe.
Bonne journée !
26 mai 2009 à 8:43
L’INSEE sert aussi parfois de “pépinière d’entreprises”
exemple : http://www.geoclip.fr/fr/p61_equipe.htm
qui a pris son envol voici dix ans !
et bien d’autres (que je connais moins bien…)
qui achètent les données brutes et en font “ce qu’ils veulent”…
au fond tout est question de méthodologie, d’éthique, de compétences technologiques liées à une sacrée capacité à exister à l’international et à partager ses outils
l’école de la fonction publique en somme
:-))
mcim
26 mai 2009 à 10:21
“qui achètent les données brutes”
Oui, toute la différence est là.
Pourrait on arrêter de se focaliser sur l’INSEE ? Les données statistiques Française sont accessibles si on les paie, super, on est très éloigné du modèle qui se dessine aux US, donc. Les votes des parlementaires, en dehors des votes solennels, sont obscurs (secret serait un abus de langage, mais l’expérience de deputesgodillots.com montre que leur communication au grand public pose des problèmes)
26 mai 2009 à 13:25
- “arrêter de se focaliser sur l’INSEE” ?
mais bien sûr…
voici un portail de données statistiques gratuites et qualifiées : http://www.statistique-publique.fr/ ;
l’administration d’Obama semble faire le même type de choix que sous nos climats, non?
http://www.infoguerre.fr/?page_id=1407 devrait pouvoir nous éclairer sur la pertinence de ces choix, dans un contexte de crise…
- “l’expérience de deputesgodillots.com” est très intéressante pour les citoyens, en effet…encore plus pour les contribuables, (du moins tous ceux qui ne sont pas occupés par leur chasse incessante aux bons plans de défiscalisation)
27 mai 2009 à 15:52
@marie-carmen
oui, INSEE, j’entendais statistique en général. Le reproche fait a data.gov est bien le même : c’est bien d’avoir la météo et tout un tas de statistique du même ordre, mais cela ne risque pas de faire avancer l’eDemocratie. Il en est de même pour les ressources que vous citez ;-)
L’experience des deputeegodilots est intéressante en cela que ce site est alimenté par la “Memoire Politique” de la Quadrature du Net, qui fourni des données brutes similaires à ce que — aux US — fournit le sénat américain.
28 mai 2009 à 7:25
petit mot pour le modérateur
l’affichage des commentaires est inversé !
pouvez-vous rectifier ?
j’avais rebondi sur le mot INSEE DU 4 et en citant geoclip
le commentaire n°5 vient donc après…
merci
bonne continuation
28 mai 2009 à 7:44
Logiciels comme outils et chiffres et méthodologies sont tous perfectibles :
Voici un exemple exemple amusant qui anthropomorphise par défaut de vigilance humaine “Lorraine Data” le collectif de têtes chercheuses de la statistique dont le dernier ouvrage est qualifié de brûlot par certains
http://www.123people.fr/s/lorraine+data