Data.gov : bien, mais peu mieux faire

Le catalogue attendu depuis longtemps des données publiques du gouvernement américain a été lancé jeudi dernier sous l’url data.gov. Les développeurs, analystes politiques et partisans de l’eDemocratie se réjouissent de par le monde, mais l’offre initiale en contenus sucite des réactions mitigées.

Vivek Kundra, le tout nouveau CIO du gouvernement (un poste à ne surtout pas confondre avec celui de NKM), est en charge du site, qui aura pour rôle d’être un répertoire centralisé pour les données gouvernementales en libre accès utilisant les formats XML, CSV, KML et bien d’autres. A l’heure du lancement, 47 groupes de données sont disponibles, et il semble que ceux-ci ait été choisies pour leur capacité à ne pas susciter de controverses.

Cela n’en est pas moins une date historique, et ce n’est probablement qu’un début. Il y a fort à parier que des mashups fort intéressantes verront le jour sous peu.

Marshall Kirkpatrick de ReadWriteWeb US ne cache pas sa frustration au sujet de la faiblesse de l’offre en matière de données :

“Il existe beaucoup plus de données gouvernementales disponibles, ailleurs que sur data.gov, mais l’administration Obama dit avoir sélectionné celle-ci sur des critères de qualité et de respect des standards. Difficile, cependant, de ne pas être un peu déçu quand on compare l’offre à ce qui est disponible sur des sites construits autour d’initiatives privées comme USGovXML.com, qui a été construit en quatre mois à peine.

26 agences gouvernementales fournissent des données à travers data.gov, mais toutes n’offrent pas des données brutes. Le FBI par exemple, se contente de proposer un widget à placer sur des sites tiers et ne donne pas accès aux données de base.”

Derek Willis du New York Times souligne que les données fournie ne sont en aucune façon sujette à aborder des sujet qui prêtent à controverse :

“La plupart sont issues de l’USGC, de l’EPA et de la météorologie nationale”, “aucune données en provenance du Department of Homeland Security (l’équivalent, grosso modo du ministère de l’intérieur Français), de l’Etat ou de Ministère de la justice”. Dans un billet publié au lendemain du lancement de data.gov, il se montre particulièrement critique à son sujet.
(disclaimer : ReadWriteWeb est partenaire du New York times dont il alimente en contenus les pages Technologie)

Pour aller dans son sens, une recherche au sein des données fournies sur des mots comme alimentation, prison, ou drogue ne donnent aucun résultat. Ces sujets sont pourtant d’une importance capitale car elles sont au coeur de débats critiques pour la justice. Apporter un éclairage nouveau à travers cette ouverture des données sur de tels sujets permettrait de faire avancer les débats en dehors de tout parti pris idéologique.

Il n’existe aucun flux RSS disponible pour les groupe de données ou pour les recherches faites sur celles ci, ce qui serait capital pour rester alerté sur l’avancée et la constitution du catalogue, mais cela sera vraisemblablement ajouté sous peu.

On pourra toujours affirmer que quelques données est préférable à pas de données du tout, mais on ne peut s’empécher d’être quelque peu décu.

Pour donner un point de vue plus optimiste et enthousiaste, on se réfèrera à John Musser de ProgammableWeb, qui écrit à ce sujet :

« C’est un départ très prometteur. Un grand pas vers l’accessibilité des données gouvernementales. Nous voyons en moment les même efforts faits dans la première version de l’accès aux votes du sénat : la première étape consiste à donner accès à des données structurées comme le XML, la suite consistera à les rendre accessibles via une API. Ils disposent d’une énorme quantité de métadonnées. Pour l’instant, le nombre de set de données n’est pas énorme, mais c’est un début”

De son coté, O’Reilly a dors et déjà lancé un concours de mashup construites sur ces données et tout le monde attends avec impatience de voir comment ces nouvelles applications vont pouvoir faire avancer la démocratie américaine.

Le gouvernement Américain a par ailleurs lancé sur le site de la maison blanche une page donnant accès à toutes les initiatives du gouvernement en la matière. Cela donne un aperçu de la multitude des initiatives de l’administration Obama en la matière et à la diversité des initiatives. A rapprocher des initiatives à venir en France en la matière.

En France, il n’est à ce jour pas question de donner accès au public aux données de l’état, les programme concernant l’eDemocratie se limitant en réalité à de l’eAdministration, fournissant un service aux administrés mais en aucun cas des données publiques aux citoyens.

A défaut d’annonce du gouvernement, il y a fort à parier que cette ouverture des données soit imposée par des initiatives citoyennes, mais il leur faudra pour cela coordonner bien des initiatives pour en faire un tout cohérent, à commencer par la collecte de données, une initiative déja largement prise en charge par La Quadrature du Net, auquel il faudra ajouter la mise à disposition de ces données dans un format d’échange, voir des API, sans oublier les passerelless à établir entre de multiples sources certes publiques mais non structurées qu’il conviendra de transformer en données structurée. Une initiative similaire a SunlightLabs http://www.sunlightlabs.com/about/ devrait voir le jour sous peu en France afin de faire avancer les choses et de construire un cadre technique et méthodologique avec les différents acteurs intéressés par le projet.


Recommandez cet article à vos amis

et rejoignez nous sur Facebook et Twitter...



11 commentaires pour cet article

  1. Jacques

    Bravo
    Bonne analyse qui est corroboré par des sources du groupe d interet W3C eGovernment intrest group.
    Il y a encore du chemin à faire

    Je pense aussi que des flux RSS personnalisables basées sur une recherche ( un peu à la mode Gallica 2 ) seraient très utiles.

    Bien à vous

    Votre papier existe-t-il aussi en anglais ?

  2. jerome cukier

    En France, il n’est à ce jour pas question de donner accès au public aux données de l’état, les programme concernant l’eDemocratie se limitant en réalité à de l’eAdministration, fournissant un service aux administrés mais en aucun cas des données publiques aux citoyens.

    hmm…

    d’abord, les USA sont le pays où la statistique publique est la plus éclatée. il y a plus de 100 agences qui produisent des données officielles… or dans la quasi totalité des pays développés il y a une seule agence (chez nous, l’insee) qui emet la quasi-totalité des données.

    il y a 2 ans, la France a lancé « statistique publique », un portail/catalogue/point d’accès pour tout le reste.

    tout ça pour dire qu’en la matière, les USA ne sont pas en avance mais plutôt sacrément à la traîne.

    maintenant sur la gratuité des données, il y a énormément de données officielles gratuites en France, le reste est à la charge des utilisateurs qui en ont besoin. l’alternative, c’est de les faire payer aux contribuables.un système où les statistiques publiques sont gratuites ne peut pas exister.

  3. Fabrice Epelboin

    @jacques

    oui, c’est ici : http://www.readwriteweb.com/archives/datagov_finally_launches_looks_nice_but_short_on_d.php

    @jerome

    L’enjeux n’est pas tant, à mon sens, dans la mise à disposition de statistiques publiques, mais dans la mise à disposition d’informations concernant la vie démocratique quotidienne d’une nation, tel que les votes des parlementaires, par exemple, ou pire, comme on peut le trouver en Suède, leurs notes de frais ;-)

  4. AbriCoCotier

    @Fabrice : A la réflexion, je pense que une période de test (pendant laquelle peut de données seraient releasées, et seulement des données non dangereuses) aurait été utilisées dans de nombreux pays. Ce qui est important, c’est de voir cette période rapidement arriver à son terme, et l’ensemble des données gouvernementales vraiment être publiées.

    @jerome : Je crois que la différence de l’initiative américaine avec l’INSEE française, c’est qu’en France, l’INSEE a les données et publie leur interprétation. Aux USA, ce sont les données brutes qui sont publiées. Chaque citoyen peut ensuite en faire ce qu’il veut. Et c’est cela qui est important.

  5. Gabriel

    Bonjour,

    Ne serait-il pas intéressant de développer un site qui regroupe les quelques données officielles ?
    Finalement sur les différents sites des ministères du gouvernement français, on trouve beaucoup d’information. Le problème est que l’on ne trouve que trop souvent les dernières statistiques en date. Ce qui est intéressant c’est de voir les évolution, de pouvoir rapidement croiser les données. C’est de cette façon que l’on peut faire émerger des tendances et des corrélations.

    Le site http://www.statistique-publique.fr me parait tout à fait exploitable mais non optimal. En effet, il n’offre que des liens vers des pages ou des fichiers contenant, sur les différents sites des ministères, l’information officielle.

    Pour ce qui est de http://www.data.gov, je ne suis pas encore convaincu. Le simple fait qu’il y ait toutes ces agences qui comptabilise me donne déjà le tournis. De plus sortir un site sans contenu alors que son unique emploi est simplifié l’accès à ce dit contenu, c’est un peu étrange. Uniquement 5 catégories sur 14 ont des data accessibles… Je reste perplexe.

    Bonne journée !

  6. iriarte-maza marie-carmen

    L’INSEE sert aussi parfois de « pépinière d’entreprises »
    exemple : http://www.geoclip.fr/fr/p61_equipe.htm
    qui a pris son envol voici dix ans !

    et bien d’autres (que je connais moins bien…)
    qui achètent les données brutes et en font « ce qu’ils veulent »…

    au fond tout est question de méthodologie, d’éthique, de compétences technologiques liées à une sacrée capacité à exister à l’international et à partager ses outils

    l’école de la fonction publique en somme
    :-))
    mcim

  7. Fabrice Epelboin

    « qui achètent les données brutes »

    Oui, toute la différence est là.

    Pourrait on arrêter de se focaliser sur l’INSEE ? Les données statistiques Française sont accessibles si on les paie, super, on est très éloigné du modèle qui se dessine aux US, donc. Les votes des parlementaires, en dehors des votes solennels, sont obscurs (secret serait un abus de langage, mais l’expérience de deputesgodillots.com montre que leur communication au grand public pose des problèmes)

  8. iriarte-maza marie-carmen

    - « arrêter de se focaliser sur l’INSEE » ?
    mais bien sûr…
    voici un portail de données statistiques gratuites et qualifiées : http://www.statistique-publique.fr/ ;
    l’administration d’Obama semble faire le même type de choix que sous nos climats, non?

    http://www.infoguerre.fr/?page_id=1407 devrait pouvoir nous éclairer sur la pertinence de ces choix, dans un contexte de crise…

    - « l’expérience de deputesgodillots.com » est très intéressante pour les citoyens, en effet…encore plus pour les contribuables, (du moins tous ceux qui ne sont pas occupés par leur chasse incessante aux bons plans de défiscalisation)

  9. Fabrice Epelboin

    @marie-carmen

    oui, INSEE, j’entendais statistique en général. Le reproche fait a data.gov est bien le même : c’est bien d’avoir la météo et tout un tas de statistique du même ordre, mais cela ne risque pas de faire avancer l’eDemocratie. Il en est de même pour les ressources que vous citez ;-)

    L’experience des deputeegodilots est intéressante en cela que ce site est alimenté par la « Memoire Politique » de la Quadrature du Net, qui fourni des données brutes similaires à ce que – aux US – fournit le sénat américain.

  10. iriarte-maza marie-carmen

    petit mot pour le modérateur

    l’affichage des commentaires est inversé !

    pouvez-vous rectifier ?

    j’avais rebondi sur le mot INSEE DU 4 et en citant geoclip

    le commentaire n°5 vient donc après…
    merci

    bonne continuation

  11. iriarte-maza marie-carmen

    Logiciels comme outils et chiffres et méthodologies sont tous perfectibles :

    Voici un exemple exemple amusant qui anthropomorphise par défaut de vigilance humaine « Lorraine Data » le collectif de têtes chercheuses de la statistique dont le dernier ouvrage est qualifié de brûlot par certains

    http://www.123people.fr/s/lorraine+data

9 Trackbacks For This Post

  1. Les USA et l’Angleterre se disputent la pole position de l’eDemocratie | ReadWriteWeb France :

    [...] de Data.gov a été célébré aux quatre coins de la planète, mais il s’est avéré limité en terme d’offre. Le sénat américain, contrôlé par les démocrates, a mis à disposition l’historique des [...]

  2. A lire ailleurs du 1er au 17 juin 2009 | traffic-internet.net :

    [...] . ReadWriteWeb France : Data.gov, bien, mais peu mieux faire Le ReadWriteWeb s’est penché sur le catalogue – encore succinct – de données publiques publiée par le gouvernement américain : data.gov. Un catalogue pour l’instant incomplet, moins fourni que ceux d’initiatives privées (comme USGovXML.com) et provenant d’administrations ne portant pas vraiment à controverses. Disons alors que c’est un début prometteur, un premier pas vers l’accessibilité des données gouvernementales qui a déjà donné lieu à un premier concours de mashups pour voir ce que l’on pourra construire de ces données ouvertes : http://sunlightlabs.com/blog/2009/05/21/apps-america-2-datagov-challenge/ [...]

  3. A lire ailleurs du 1er au 17 juin 2009 | MKT planet - News Web Marketing - Nouvelles Technologies :

    [...] . ReadWriteWeb France : Data.gov, bien, mais peu mieux faire Le ReadWriteWeb s’est penché sur le catalogue – encore succinct – de données publiques publiée par le gouvernement américain : data.gov. Un catalogue pour l’instant incomplet, moins fourni que ceux d’initiatives privées (comme USGovXML.com) et provenant d’administrations ne portant pas vraiment à controverses. Disons alors que c’est un début prometteur, un premier pas vers l’accessibilité des données gouvernementales qui a déjà donné lieu à un premier concours de mashups pour voir ce que l’on pourra construire de ces données ouvertes : http://sunlightlabs.com/blog/2009/05/21/apps-america-2-datagov-challenge/ [...]

  4. Crowdsourcer Data.gov avec TransparencyCorps | ReadWriteWeb France :

    [...] de grands espoirs, Data.gov déçoit. Les données disponibles sur le site ne sont pas réellement celles qui seraient en mesure de [...]

  5. Des Open Data sans censures | bertrandkeller :

    [...] Plus facile à dire qu’à faire. Si le web est un territoire (qui ressemblerait à une méduse), il est nécessaire de l’organiser pour y appliquer ce qu’on appellerait eDemocratie. Pour mettre en place eDemocratie, il ne faut pas le faire à moitié. Mettre une partie des données à disposition ce n’est pas suffisant ; vous entendrez donc quelques critiques à propos de data.gov. [...]

  6. Data.gov a de la concurrence | ReadWriteWeb France :

    [...] le catalogue de données publiques quelque peu décevant lancé par le gouvernement américain, destiné à donner naissance à un écosystème de mashup [...]

  7. La ville de Portland en Oregon ouvre officiellement ses données | ReadWriteWeb France :

    [...] France a beaucoup de retard en la matière. Comme Fabrice Epelboin le dit dans un article consacré à Data.gov : « En France, il n’est à ce jour pas question de donner accès au public aux données de [...]

  8. Quel modèle pour le data.gov Français ? | ReadWriteWeb France :

    [...] des données, formats d'échanges, cas d'utilisation et peut être aussi… politique. Car depuis l'ouverture de data.gov aux US, données et transparence font bon ménage. L'arrivée de Tim Berners Lee dans le projet [...]

  9. Data.gov:Quelques articles « Codeninjaz's Blog :

    [...] readwriteweb.fr: là et [...]

  • A propos
  • Best of
  • Buzzing
  • Tags

ReadWriteWeb est un blog dédié aux technologies internet qui en couvre l’actualité et se distingue par ses notes d’analyse et de prospective ainsi que par l’accent mis sur les usages et leurs impacts sur les média, la communication et la société. Il est classé parmi les blogs les plus influents de la planète par Technorati et Wikio. Publié en cinq langues, il s'appuie sur un réseau de correspondants locaux en Nouvelle-Zélande, aux Etats-Unis, en France, en Espagne, au Brésil, en Chine ainsi qu'en Afrique francophone. Ses articles sont publiés dans la rubrique technologie du New York Times.


Partenaires

hébergement infogérance Bearstech
ATLN Association Tunisienne pour les Libertés Numériques

af83



Tunisie média

Appli iPhone


 

Recommandés



Activité sur le site