Crowdsourcer Data.gov avec TransparencyCorps

Malgré de grands espoirs, Data.gov déçoit. Les données disponibles sur le site ne sont pas réellement celles qui seraient en mesure de changer la démocratie, et pas non plus celles qui pourraient éclairer l’action politique sous un jour nouveau.

Mais dans la course à l’eDémocratie, et ce dans chaque pays, deux mouvements font la course : celui des gouvernements, qui savent que ce mouvement les mènera inexorablement à des mutations profondes qu’ils ne sont pas toujours sûr de maitriser – c’est un euphémisme – et celui des citoyens, dont beaucoup appellent ces mutations de leurs vœux, comme la Mémoire Politique, un projet de la Quadrature du Net.

La Sunlight Foundation est une ONG Américaine qui se consacre à la mise au point d’outils et d’initiatives destinées à accélérer l’eDemocratie, essentiellement en mettant au point des outils technologiques destinés à améliorer la transparence et la communication au sein de la démocratie américaine, mais pas seulement. Ses solutions logicielles étant open source, son intention est – comme souvent avec les ONG pro démocratie américaine – globale.

Sa dernière initiative en date, TransparencyCorps, a toute les chance de remporter un succès mondial. Construit sur le modèle de Mechanical Turk d’Amazon, le site demande à ses visiteurs de réaliser une tâche simple et rapide que les humains font bien mieux qu’une machine.

La première mission confiée au système est de de créer un annuaire de tous les élus américains ayant un compte Twitter (il y en a beaucoup la bas), la seconde, plus sérieuse, est de résumer (et sémantiser) des demandes de financement faites auprès du Congrès Américain en saisissant, dans des champs spécifiques, des informations que l’on trouve dans des documents officiels émis par l’administration américaine. On alimente ainsi une base de données qui pourra plus tard fournir ces informations dument structurées à une multitude de mashups.

Le système est particulièrement plaisant à utiliser, 5 minutes suffisent pour remplir une tâche : celle-ci commence par la requête qu’il faut faire d’un document à saisir dans la base de données à l’aide d’un formulaire, puis le système demande à de multiples volontaires de vérifier et de compléter les saisies. Une fois les champs comme la somme d’argent demandée ou l’adresse du demandeur complétés, les données sont disponibles dans un format structuré.  Cela signifie que qu’elles seront plus facile à chercher, analyser, visualiser, transformer et mashuper.

Et voilà : quelques minutes de votre temps permettent de transformer des documents gouvernementaux informes et inutilisables pour un ordinateur en données structurées qui pourront donner des choses incroyables une fois passé dans la moulinette de développeurs, qui transformeront ces données en quelque chose d’utile ou d’inédit, destiné à faire avancer la démocratie et la transparence.

Les données gouvernementales structurées permettent une multitude de recherches, comme par exemple la découverte de structures particulières dans certaines activités gouvernementales, qui méritent qu’on s’y attarde, ou qui appellent à un changement.

Les participants au projet TransparencyCorps gagnent des points (une monnaie virtuelle, sur le modèle des whuffies), ces points leur permettent de grimper dans une hiérarchie et de siéger au conseil des “leaders de la transparence”. L’incentive peut paraître frivole, mais la tâche réalisé n’en est pas moins essentielle.

On attends avec impatience la version iPhone, qui permettrait aux participant d’occuper utilement leur temps perdu dans les transports, une interaction avec Twitter et Facebook qui leur permettrait de valoriser leur participation au sein de leur espaces sociaux sur internet et de recruter de nouveaux participant par la même occasion.

Contrairement au Mecanical Turk d’Amazon, où ceux qui travaillent sont payés de petites sommes, TransparencyCorps fonctionne sur le bénévolat, et la mise en valeur des participant sera sans nul doute le plus gros challenge du projet. Si ce défit est relevé, il y a fort à parier que le projet sera une réussite.

Il y a fort à parier qu’une telle initiative verra le jour sous peu en France. Le code, du Ruby on rails, est en open source, les bonnes volontés ne manquent pas, même au gouvernement, on trouve des responsables qui verraient de telles initiatives d’un bon œil (si, si, je vous jure).

Si vous êtes intéressé, laissez un message.

(photo d’ouverture CC-by de Jacreative)

A lire également :

  1. Data.gov : bien, mais peu mieux faire Le cata­logue attendu depuis long­temps des don­nées publiques du gou­ver­ne­ment amé­ri­cain a été lancé jeudi der­nier sous l’url data.gov. Les déve­lop­peurs, ana­lystes poli­tiques et par­ti­sans de l’eDemocratie se réjouissent de par le monde, mais l’offre ini­tiale en conte­nus sucite des réac­tions mitigées. Vivek Kundra, le tout nou­veau CIO du gou­ver­ne­ment...
  2. Data.gov a de la concurrence Data.gov, le cata­logue de don­nées publiques quelque peu déce­vant lancé par le gou­ver­ne­ment amé­ri­cain, des­tiné à don­ner nais­sance à un écosys­tème de mashup pour ana­ly­ser et visua­li­ser ces don­née, a désor­mais une concur­rence sérieuse. La Sunlight Foundation, une fon­da­tion apo­li­tique qui vise à la trans­pa­rence en poli­tique, a annoncé le lan­ce­ment pro­chain...
  3. Data mining sur Facebook : ça fait peur Le Data Mining, c’est l’art d’explorer une masse gigan­tesque de don­nées à la recherche de sens, c’est un sport pra­tiqué depuis long­temps, entre autre par de mul­tiples ser­vices mar­ke­ting, et c’est tout sauf une nou­veauté. Ce qui l’est, nou­veau, c’est les pers­pec­tives ouvertes par cet article du Boston Globe...
  4. Quel modèle pour le data.gov Français ? Demain samedi aura lieu à la can­tine le pre­mier Open Data Camp. On y par­lera confi­den­tia­lité des don­nées, for­mats d’échanges, cas d’utilisation et peut être aussi… poli­tique. Car depuis l’ouverture de data.gov aux US, don­nées et trans­pa­rence font bon ménage. L’arrivée de Tim Berners Lee dans le projet Anglais a été...
  5. Les politiques jouent avec le feu sur Twitter Même NKM, la poli­tique Française qui maî­trise le mieux Twitter s’y est laissé prendre… Balancer les cas­se­roles de ses concur­rents en période élec­to­rale est devenu l’un des usages pré­fé­rés des poli­tiques sur Twitter. Oui, ces même poli­tiques qui pestent contre la ‘rumeur’, impos­sible à faire taire sur un inter­net qu’il...
  6. Yahoo prépare un Data Center écolo Yahoo a annoncé le mois der­nier son inten­tion de construire à Lockport, dans l’état de New York un centre infor­ma­tique presque entiè­re­ment ali­menté par de l’énergie hydro­élec­trique pro­duite par les chutes du Niagara. Le Data Center, dont l’energie sera à 90% hydro­élec­trique, uti­li­sera un mode de refroi­dis­se­ment ins­piré des pou­laillers...
  7. La Maison Blanche se dote d’un clone de Digg pour interagir avec les citoyens américains La Maison Blanche vient de lan­cer un nou­veau site web sur le modèle de Digg où tout le monde peut pro­po­ser ou voter pour la ques­tion qui lui tien le plus à coeur concer­nant l’économie du pays. Un clone de Digg ! Obama répon­dra aux ques­tions qui auront été les...

8 commentaires pour cet article

  1. Nicolas Cynober

    “Les par­ti­ci­pants au projet TransparencyCorps gagnent des points”… Youpi ! Vivement la même ver­sion en France, je rêve­rais de gagner des points :)

    Ceici dit, quand on regarde de plus près l’Open Government Initiative on se dit que créer un ser­vice web 2.0 qui dis­tri­bue des bons points a plus de chance de créer des don­nées struc­tu­rées que l’initiative gou­ver­ne­men­tale en cours.

  2. Fabrice Epelboin

    C’est le point faible, so to speak… L’incentive est un peu légère, ceci dit, ça se tra­vaille, ce n’est pas rédhibitoire ;-)

  3. renaud

    Pour l’incentive, à voir sur le MT-LT. En deve­nant un inter­mé­diaire don­nées entre le gou­ver­ne­ment et la popu­la­tion, ce genre d’initiative se place dans une posi­tion de pou­voir fort et en crois­sance.
    Peut-on ima­gi­ner que dans quelques années, les lea­ders de ces ini­tia­tives inter­viennent direc­te­ment ou soient consul­tés par les gou­ver­ne­ments en place ?

  4. Louis

    @Nicolas Cynober : Heu, don­ner des points, c’est toujours plus/mieux que de ne rien don­ner du tout.

    Et, si je me sou­viens bien, sur Wikipédia, les contri­bu­teurs ne gagnent pas grand chose. Et pour­tant ils contri­buent. Et au final, ça fait Wikipédia, aujourd’hui base de connais­sance recon­nue et respectée.

    Bref : le béné­vo­lat, lorsqu’il va vers de la trans­pa­rence et la connais­sance, n’est pas si risible que ça.

  5. Nicolas Cynober

    @Louis
    Je vais pré­ci­ser ma pen­sée. Donner des points ne suf­fit pas, il faut un béné­fice perçu plus fort. Wikipedia offre un béné­fice immé­diat: dès que tu as appuyé sur le bou­ton de vali­da­tion tu vois tes modi­fi­ca­tions s’afficher sur l’encyclopédie la plus grande au monde, tu as par­ti­cipé à écrire l’histoire! Comme béné­fice perçu en 1 click: c’est plu­tôt fort…

    La tu gagnes des points… so what?

    Ce qui aurait été inté­res­sant c’est de visua­li­ser en temps réel l’impact de l’ajout de tes don­nées.
    ex: Un gros camem­bert pour une étude X ou Y dont la répar­ti­tion change dès que tu valides tes don­nées. Avec genre un petit signe qui te montre quelle par­tie du camem­bert grossi et dans quelle pro­por­tion (pourcentage).

  6. jean-lou bourgeon

    Ben y a du pain sur la planche… Effectivement quand on tente de lire les textes de lois (en pdf), c’est à n’y rien com­prendre, com­pliqué, très mal hié­rar­chisé, … et encore quand on pas des scans de docs dac­ty­lo­gra­phiés, je dis bien dac­ty­lo­gra­phiées (en 2009…) voire manus­crit (assez rare objectivement).

    Cela dit, il serait temps de s’y mettre et il faut encou­ra­ger l’initiative et sa mise en oeuvre.
    C’est une appli­ca­tion du crowd­sour­cing (à modu­ler cepen­dant, il n’est pas assi­mi­lable au béné­vo­lat, le crowd­sour­cing étant une acti­vité issue de l’entreprise pri­vée), avec un impact basique : faire prendre conscience et apprendre aux citoyens ce qu’est la vie publique (par oppo­si­tion à l’entreprise, l’initiative pri­vée), régie, elle par des codes et règle­ments très sou­vent obs­curs, abs­cons, ubuesques, surréalistes…

    Oui ça ferait du bien à plus d’un admi­nis­tré (enquête perso 10 jours avant les euro­péennes, le bide total, pas 1/10 inter­rogé ne savait qui dans cir­cons­crip­tion (vaste pour les euro­péennes, j’en conviens) se pré­sen­tait. Il fal­lait remon­ter jusqu’au élus pour avoir un résul­tat satis­fai­sant (donc per­fec­tible…). Commission Europe, Conseil de l’Europe, c’est la grande patauge… Et pour­tant beau­coup se fait à Strasbourg.

    Point les points on pour­rait sus­ci­ter les voca­tions et dépé­na­li­ser les pirates qui ver­raient ainsi leur peine Hadopi amoin­dri au pro­rata de leur impli­ca­tion… Non, juste délire de l’instant…

    Je veux bien te croire, Francis, mais dire que la France va s’y jeter, là j’ai un doute, mais puisque tu le dis, alors…

  7. jean-lou bourgeon

    Fabrice,

    Je reviens sur le cap­ti­vant débat ini­tié par MacManus dans l’entretien qu’il a eu avec Tim Berners-Lee récem­ment et d’apporter cet éclai­rage : http://gigaom.com/2009/07/12/big-data-and-real-time-web-a-confluence-of-streams/#more-55641.

    C’est sur GigaOm, sous la plume de Michaël Franklin dans un post inti­tulé : Why Big Data & Real-Time Web Are Made For Each Other

    C’est un élément com­plé­men­taire à la com­pré­hen­sion du lin­ked data cloud évoqué…

  8. AbriCoCotier

    @jean-lou bour­geon : OK, c’est pas gagné, mais bon, je crois qu’on est tous d’accord pour dire que les enjeux sont grands et importants.

    Bref : on sait que le jeux en vaut la chan­delle, mais que le jeu n’est pas aisé. Ne reste plus qu’à se bou­ger les fesses (je crois pas qu’il faille attendre les poli­tiques sur ce coup là non plus : inter­net montre davan­tage de l’auto-democratie que de l’e-democratie…)

1 Trackbacks For This Post

  1. L’Etat de New York se met aux média sociaux « MNE Bordeaux Aquitaine :

    […] Crowdsourcer Data.gov avec TransparencyCorps […]

Réagissez !

  • A propos
  • Best of
  • Buzzing
  • Tags

ReadWriteWeb est un blog dédié aux technologies internet qui en couvre l’actualité et se distingue par ses notes d’analyse et de prospective ainsi que par l’accent mis sur les usages et leur impact sur les média, la communication et la société.

ReadWriteWeb est classé parmi les blogs les plus influents de la planète par Technorati et Wikio, il est publié en anglais, en français, en coréen, en espagnol, en portugais et en chinois. Ses articles sont publiés dans la rubrique technologie du New York Times.

Nous soutenons…

Partenaires

hébergement infogérance Bearstech
af83



Démenti concer­nant l’implication de l’ISOC dans la mise à mort de la net neu­tra­lity » cliquer ici



Publications

Lawrence Lessig
Culture Libre



Pierre Bellanger
La Radio IP