Data.gov : bien, mais peu mieux faire

Le catalogue attendu depuis longtemps des données publiques du gouvernement américain a été lancé jeudi dernier sous l’url data.gov. Les développeurs, analystes politiques et partisans de l’eDemocratie se réjouissent de par le monde, mais l’offre initiale en contenus sucite des réactions mitigées.

Vivek Kundra, le tout nouveau CIO du gouvernement (un poste à ne surtout pas confondre avec celui de NKM), est en charge du site, qui aura pour rôle d’être un répertoire centralisé pour les données gouvernementales en libre accès utilisant les formats XML, CSV, KML et bien d’autres. A l’heure du lancement, 47 groupes de données sont disponibles, et il semble que ceux-ci ait été choisies pour leur capacité à ne pas susciter de controverses.

Cela n’en est pas moins une date historique, et ce n’est probablement qu’un début. Il y a fort à parier que des mashups fort intéressantes verront le jour sous peu.

Marshall Kirkpatrick de ReadWriteWeb US ne cache pas sa frustration au sujet de la faiblesse de l’offre en matière de données :

“Il existe beaucoup plus de données gouvernementales disponibles, ailleurs que sur data.gov, mais l’administration Obama dit avoir sélectionné celle-ci sur des critères de qualité et de respect des standards. Difficile, cependant, de ne pas être un peu déçu quand on compare l’offre à ce qui est disponible sur des sites construits autour d’initiatives privées comme USGovXML.com, qui a été construit en quatre mois à peine.

26 agences gouvernementales fournissent des données à travers data.gov, mais toutes n’offrent pas des données brutes. Le FBI par exemple, se contente de proposer un widget à placer sur des sites tiers et ne donne pas accès aux données de base.”

Derek Willis du New York Times souligne que les données fournie ne sont en aucune façon sujette à aborder des sujet qui prêtent à controverse :

“La plupart sont issues de l’USGC, de l’EPA et de la météorologie nationale”, “aucune données en provenance du Department of Homeland Security (l’équivalent, grosso modo du ministère de l’intérieur Français), de l’Etat ou de Ministère de la justice”. Dans un billet publié au lendemain du lancement de data.gov, il se montre particulièrement critique à son sujet.
(disclaimer : ReadWriteWeb est partenaire du New York times dont il alimente en contenus les pages Technologie)

Pour aller dans son sens, une recherche au sein des données fournies sur des mots comme alimentation, prison, ou drogue ne donnent aucun résultat. Ces sujets sont pourtant d’une importance capitale car elles sont au coeur de débats critiques pour la justice. Apporter un éclairage nouveau à travers cette ouverture des données sur de tels sujets permettrait de faire avancer les débats en dehors de tout parti pris idéologique.

Il n’existe aucun flux RSS disponible pour les groupe de données ou pour les recherches faites sur celles ci, ce qui serait capital pour rester alerté sur l’avancée et la constitution du catalogue, mais cela sera vraisemblablement ajouté sous peu.

On pourra toujours affirmer que quelques données est préférable à pas de données du tout, mais on ne peut s’empécher d’être quelque peu décu.

Pour donner un point de vue plus optimiste et enthousiaste, on se réfèrera à John Musser de ProgammableWeb, qui écrit à ce sujet :

« C’est un départ très prometteur. Un grand pas vers l’accessibilité des données gouvernementales. Nous voyons en moment les même efforts faits dans la première version de l’accès aux votes du sénat : la première étape consiste à donner accès à des données structurées comme le XML, la suite consistera à les rendre accessibles via une API. Ils disposent d’une énorme quantité de métadonnées. Pour l’instant, le nombre de set de données n’est pas énorme, mais c’est un début”

De son coté, O’Reilly a dors et déjà lancé un concours de mashup construites sur ces données et tout le monde attends avec impatience de voir comment ces nouvelles applications vont pouvoir faire avancer la démocratie américaine.

Le gouvernement Américain a par ailleurs lancé sur le site de la maison blanche une page donnant accès à toutes les initiatives du gouvernement en la matière. Cela donne un aperçu de la multitude des initiatives de l’administration Obama en la matière et à la diversité des initiatives. A rapprocher des initiatives à venir en France en la matière.

En France, il n’est à ce jour pas question de donner accès au public aux données de l’état, les programme concernant l’eDemocratie se limitant en réalité à de l’eAdministration, fournissant un service aux administrés mais en aucun cas des données publiques aux citoyens.

A défaut d’annonce du gouvernement, il y a fort à parier que cette ouverture des données soit imposée par des initiatives citoyennes, mais il leur faudra pour cela coordonner bien des initiatives pour en faire un tout cohérent, à commencer par la collecte de données, une initiative déja largement prise en charge par La Quadrature du Net, auquel il faudra ajouter la mise à disposition de ces données dans un format d’échange, voir des API, sans oublier les passerelless à établir entre de multiples sources certes publiques mais non structurées qu’il conviendra de transformer en données structurée. Une initiative similaire a SunlightLabs http://www.sunlightlabs.com/about/ devrait voir le jour sous peu en France afin de faire avancer les choses et de construire un cadre technique et méthodologique avec les différents acteurs intéressés par le projet.

A lire également :

  1. Crowdsourcer Data.gov avec TransparencyCorps ...
  2. Skype disponible sur l’iPhone est bien parti pour être un géant des Telco du XXIe siècle ...
  3. Socialmedian ajoute un flux d’information, comme Friendfeed mais sans le bruit ...
  4. Data.gov a de la concurrence ...
  5. Data mining sur Facebook : ça fait peur ...
  6. Les ados ne sont pas sur Twitter, mais cela ne saurait tarder ...

11 commentaires pour cet article

  1. Jacques

    Bravo
    Bonne ana­lyse qui est cor­ro­boré par des sources du groupe d interet W3C eGo­vern­ment intrest group.
    Il y a encore du che­min à faire 

    Je pense aussi que des flux RSS per­son­na­li­sables basées sur une recherche ( un peu à la mode Gallica 2 ) seraient très utiles.

    Bien à vous

    Votre papier existe-t-il aussi en anglais ?

  2. jerome cukier

    En France, il n’est à ce jour pas ques­tion de don­ner accès au public aux don­nées de l’état, les pro­gramme concer­nant l’eDemocratie se limi­tant en réa­lité à de l’eAdministration, four­nis­sant un ser­vice aux admi­nis­trés mais en aucun cas des don­nées publiques aux citoyens.

    hmm…

    d’abord, les USA sont le pays où la sta­tis­tique publique est la plus écla­tée. il y a plus de 100 agences qui pro­duisent des don­nées offi­cielles… or dans la quasi tota­lité des pays déve­lop­pés il y a une seule agence (chez nous, l’insee) qui emet la quasi-totalité des données.

    il y a 2 ans, la France a lancé “sta­tis­tique publique”, un portail/catalogue/point d’accès pour tout le reste. 

    tout ça pour dire qu’en la matière, les USA ne sont pas en avance mais plu­tôt sacré­ment à la traîne. 

    main­te­nant sur la gra­tuité des don­nées, il y a énor­mé­ment de don­nées offi­cielles gra­tuites en France, le reste est à la charge des uti­li­sa­teurs qui en ont besoin. l’alternative, c’est de les faire payer aux contribuables.un sys­tème où les sta­tis­tiques publiques sont gra­tuites ne peut pas exister.

  3. Fabrice Epelboin

    @jacques

    oui, c’est ici : http://www.readwriteweb.com/archives/datagov_finally_launches_looks_nice_but_short_on_d.php

    @jerome

    L’enjeux n’est pas tant, à mon sens, dans la mise à dis­po­si­tion de sta­tis­tiques publiques, mais dans la mise à dis­po­si­tion d’informations concer­nant la vie démo­cra­tique quo­ti­dienne d’une nation, tel que les votes des par­le­men­taires, par exemple, ou pire, comme on peut le trou­ver en Suède, leurs notes de frais ;-)

  4. AbriCoCotier

    @Fabrice : A la réflexion, je pense que une période de test (pen­dant laquelle peut de don­nées seraient relea­sées, et seule­ment des don­nées non dan­ge­reuses) aurait été uti­li­sées dans de nom­breux pays. Ce qui est impor­tant, c’est de voir cette période rapi­de­ment arri­ver à son terme, et l’ensemble des don­nées gou­ver­ne­men­tales vrai­ment être publiées.

    @jerome : Je crois que la dif­fé­rence de l’initiative amé­ri­caine avec l’INSEE française, c’est qu’en France, l’INSEE a les don­nées et publie leur inter­pré­ta­tion. Aux USA, ce sont les don­nées brutes qui sont publiées. Chaque citoyen peut ensuite en faire ce qu’il veut. Et c’est cela qui est important.

  5. Gabriel

    Bonjour,

    Ne serait-il pas inté­res­sant de déve­lop­per un site qui regroupe les quelques don­nées offi­cielles ?
    Finalement sur les dif­fé­rents sites des minis­tères du gou­ver­ne­ment français, on trouve beau­coup d’information. Le pro­blème est que l’on ne trouve que trop sou­vent les der­nières sta­tis­tiques en date. Ce qui est inté­res­sant c’est de voir les évolu­tion, de pou­voir rapi­de­ment croi­ser les don­nées. C’est de cette façon que l’on peut faire émer­ger des ten­dances et des corrélations.

    Le site http://www.statistique-publique.fr me parait tout à fait exploi­table mais non opti­mal. En effet, il n’offre que des liens vers des pages ou des fichiers conte­nant, sur les dif­fé­rents sites des minis­tères, l’information officielle.

    Pour ce qui est de http://www.data.gov, je ne suis pas encore convaincu. Le simple fait qu’il y ait toutes ces agences qui comp­ta­bi­lise me donne déjà le tour­nis. De plus sor­tir un site sans contenu alors que son unique emploi est sim­pli­fié l’accès à ce dit contenu, c’est un peu étrange. Uniquement 5 caté­go­ries sur 14 ont des data acces­sibles… Je reste perplexe.

    Bonne jour­née !

  6. iriarte-maza marie-carmen

    L’INSEE sert aussi par­fois de “pépi­nière d’entreprises”
    exemple : http://www.geoclip.fr/fr/p61_equipe.htm
    qui a pris son envol voici dix ans !

    et bien d’autres (que je connais moins bien…)
    qui achètent les don­nées brutes et en font “ce qu’ils veulent”…

    au fond tout est ques­tion de métho­do­lo­gie, d’éthique, de com­pé­tences tech­no­lo­giques liées à une sacrée capa­cité à exis­ter à l’international et à par­ta­ger ses outils

    l’école de la fonc­tion publique en somme
    :-))
    mcim

  7. Fabrice Epelboin

    “qui achètent les don­nées brutes”

    Oui, toute la dif­fé­rence est là.

    Pourrait on arrê­ter de se foca­li­ser sur l’INSEE ? Les don­nées sta­tis­tiques Française sont acces­sibles si on les paie, super, on est très éloi­gné du modèle qui se des­sine aux US, donc. Les votes des par­le­men­taires, en dehors des votes solen­nels, sont obs­curs (secret serait un abus de lan­gage, mais l’expérience de deputesgodillots.com montre que leur com­mu­ni­ca­tion au grand public pose des problèmes)

  8. iriarte-maza marie-carmen

    - “arrê­ter de se foca­li­ser sur l’INSEE” ?
    mais bien sûr…
    voici un por­tail de don­nées sta­tis­tiques gra­tuites et qua­li­fiées : http://www.statistique-publique.fr/ ;
    l’administration d’Obama semble faire le même type de choix que sous nos cli­mats, non?

    http://www.infoguerre.fr/?page_id=1407 devrait pou­voir nous éclai­rer sur la per­ti­nence de ces choix, dans un contexte de crise…

    - “l’expérience de deputesgodillots.com” est très inté­res­sante pour les citoyens, en effet…encore plus pour les contri­buables, (du moins tous ceux qui ne sont pas occu­pés par leur chasse inces­sante aux bons plans de défiscalisation)

  9. Fabrice Epelboin

    @marie-carmen

    oui, INSEE, j’entendais sta­tis­tique en géné­ral. Le reproche fait a data.gov est bien le même : c’est bien d’avoir la météo et tout un tas de sta­tis­tique du même ordre, mais cela ne risque pas de faire avan­cer l’eDemocratie. Il en est de même pour les res­sources que vous citez ;-)

    L’experience des depu­tee­go­di­lots est inté­res­sante en cela que ce site est ali­menté par la “Memoire Politique” de la Quadrature du Net, qui fourni des don­nées brutes simi­laires à ce que — aux US — four­nit le sénat américain.

  10. iriarte-maza marie-carmen

    petit mot pour le modérateur

    l’affichage des com­men­taires est inversé !

    pouvez-vous rec­ti­fier ?

    j’avais rebondi sur le mot INSEE DU 4 et en citant geoclip

    le com­men­taire n°5 vient donc après…
    merci 

    bonne conti­nua­tion

  11. iriarte-maza marie-carmen

    Logiciels comme outils et chiffres et métho­do­lo­gies sont tous perfectibles :

    Voici un exemple exemple amu­sant qui anthro­po­mor­phise par défaut de vigi­lance humaine “Lorraine Data” le col­lec­tif de têtes cher­cheuses de la sta­tis­tique dont le der­nier ouvrage est qua­li­fié de brû­lot par certains 

    http://www.123people.fr/s/lorraine+data

7 Trackbacks For This Post

  1. Les USA et l’Angleterre se disputent la pole position de l’eDemocratie | ReadWriteWeb France :

    […] de Data.gov a été célé­bré aux quatre coins de la pla­nète, mais il s’est avéré limité en terme d’offre. Le sénat amé­ri­cain, contrôlé par les démo­crates, a mis à dis­po­si­tion l’historique des […]

  2. A lire ailleurs du 1er au 17 juin 2009 | traffic-internet.net :

    […] . ReadWriteWeb France : Data.gov, bien, mais peu mieux faire Le ReadWriteWeb s’est pen­ché sur le cata­logue — encore suc­cinct — de don­nées publiques publiée par le gou­ver­ne­ment amé­ri­cain : data.gov. Un cata­logue pour l’instant incom­plet, moins fourni que ceux d’initiatives pri­vées (comme USGovXML.com) et pro­ve­nant d’administrations ne por­tant pas vrai­ment à contro­verses. Disons alors que c’est un début pro­met­teur, un pre­mier pas vers l’accessibilité des don­nées gou­ver­ne­men­tales qui a déjà donné lieu à un pre­mier concours de mashups pour voir ce que l’on pourra construire de ces don­nées ouvertes : http://sunlightlabs.com/blog/2009/05/21/apps-america-2-datagov-challenge/ […]

  3. A lire ailleurs du 1er au 17 juin 2009 | MKT planet - News Web Marketing - Nouvelles Technologies :

    […] . ReadWriteWeb France : Data.gov, bien, mais peu mieux faire Le ReadWriteWeb s’est pen­ché sur le cata­logue — encore suc­cinct — de don­nées publiques publiée par le gou­ver­ne­ment amé­ri­cain : data.gov. Un cata­logue pour l’instant incom­plet, moins fourni que ceux d’initiatives pri­vées (comme USGovXML.com) et pro­ve­nant d’administrations ne por­tant pas vrai­ment à contro­verses. Disons alors que c’est un début pro­met­teur, un pre­mier pas vers l’accessibilité des don­nées gou­ver­ne­men­tales qui a déjà donné lieu à un pre­mier concours de mashups pour voir ce que l’on pourra construire de ces don­nées ouvertes : http://sunlightlabs.com/blog/2009/05/21/apps-america-2-datagov-challenge/ […]

  4. Crowdsourcer Data.gov avec TransparencyCorps | ReadWriteWeb France :

    […] de grands espoirs, Data.gov déçoit. Les don­nées dis­po­nibles sur le site ne sont pas réel­le­ment celles qui seraient en mesure de […]

  5. Des Open Data sans censures | bertrandkeller :

    […] Plus facile à dire qu’à faire. Si le web est un ter­ri­toire (qui res­sem­ble­rait à une méduse), il est néces­saire de l’organiser pour y appliquer ce qu’on appel­le­rait eDe­mo­cra­tie. Pour mettre en place eDe­mo­cra­tie, il ne faut pas le faire à moi­tié. Mettre une par­tie des don­nées à dis­po­si­tion ce n’est pas suf­fi­sant ; vous enten­drez donc quelques cri­tiques à pro­pos de data.gov. […]

  6. Data.gov a de la concurrence | ReadWriteWeb France :

    […] le cata­logue de don­nées publiques quelque peu déce­vant lancé par le gou­ver­ne­ment amé­ri­cain, des­tiné à don­ner nais­sance à un écosys­tème de mashup […]

  7. La ville de Portland en Oregon ouvre officiellement ses données | ReadWriteWeb France :

    […] France a beau­coup de retard en la matière. Comme Fabrice Epelboin le dit dans un article consa­cré à Data.gov : « En France, il n’est à ce jour pas ques­tion de don­ner accès au public aux don­nées de […]

Réagissez !

Ils nous soutiennent

feedback2.0

hébergement infogérance BearstechLa Cantine

 

  • A propos
  • Best of
  • Buzzing
  • Tags

ReadWriteWeb est un blog dédié aux technologies internet qui en couvre l’actualité et se distingue par ses notes d’analyse et de prospective ainsi que par l’accent mis sur les usages et leur impact sur les média, la société et la communication.

ReadWriteWeb est classé parmi les blogs les plus influents de la planète par Technorati et Wikio.

ReadWriteWeb est publié en anglais, en français, en coréen, en portugais et en chinois. Ses articles sont publiés dans la rubrique technologie du New York Times.


eBooks

Lawrence Lessig
Culture Libre



Pierre Bellanger
La Radio IP



Nous y serons