Data mining sur Facebook : ça fait peur

facebook Le Data Mining, c’est l’art d’explorer une masse gigantesque de données à la recherche de sens, c’est un sport pratiqué depuis longtemps, entre autre par de multiples services marketing, et c’est tout sauf une nouveauté. Ce qui l’est, nouveau, c’est les perspectives ouvertes par cet article du Boston Globe sur les possibilités offertes par les données personnelles de Facebook en termes de Datamining.

Nous avons par le passé couvert à de multiples reprises les problématiques concernant la vie privée sur Facebook, réglages des options, politique internet & vie privée de Facebook, plans secrets visant à vendre ses données pour faire des études de marché, tout y est passé, mais la perspective de voir les données des utilisateurs du plus grand réseau social du monde utilisées pour bien d’autres choses que de la publicité ciblée est quelque peu dérangeante.

Une expérience du MIT appelée “Gaydar” par ses créateurs Carter Jernigan et Behram Mistree, utilise des techniques de datamining pour déterminer des caractéristiques d’un utilisateur Facebook sur la base des informations affichées par ses amis. A l’aide de leurs profils, le logiciel est capable de prédire votre positionnement politique, votre religion, et même votre orientation sexuelle.

L’idée de base est que des amis sont enclins a partager ces traits, et l’on peut se demander si cet axiome se transposerait avec succès dans la société Française où l’intégration, quoi que l’on en pense, a donné un corps social très différent du melting pot US, mais le logiciel mis au point au MIT n’en reste pas moins intrigant…

Pour Hal Abelson, le professeur qui a dirigé l’étude, “cela coupe l’herbe sous les pieds de ceux qui affirment que la solution au problème de la vie privée est de donner un total contrôle des données aux utilisateurs”. En effet, à aucun moment ce logiciel n’utilise les données figurant sur le profil de la personne étudiée pour faire ses prédictions, il se contente de parcourir les données affichées par ses amis.

On attend de voir la réaction du public et des analystes des problématiques de vie privée face à cette nouvelle technique d’exploration des données issues des réseaux sociaux, et on se plait à imaginer l’utilisation que pourrait en faire des Etats, comme celle consistant à démasquer les fraudeurs du fisc américain. On attends aussi de revoir surgir du bois les théories du complot fantaisistes qui affirment que Facebook est financé par la CIA dans le seul but de faire de telles analyses, l’une des théories du complot les plus absurdes sortie sur internet, et qui, c’est surprenant, n’est jamais apparue à la télévision (une erreur, probablement).

images CC-by de Cаvin 〄 et Jacob Bøtter

A lire également :

  1. Facebook Principles : Les règles qui régiront le développement de Facebook ...
  2. Crowdsourcer Data.gov avec TransparencyCorps ...
  3. MySpace mobile pour contrer Facebook ? ...
  4. Facebook au travail : utile ou pas ? ...
  5. Nouveau Facebook le 11 mars prochain ...
  6. Facebook se lance dans la mesure du bonheur national ...
  7. Storytlr fait avancer le lifestreaming ...

2 commentaires pour cet article

  1. Edouard

    Merci pour cet article très inté­res­sant, nous ne manque­rons pas de relayer l’information. Je vous ren­voie pour com­plé­ment d’info à un article “syn­thèse” de ce qu’il faut savoir sur Facebook aujourd’hui: http://www.athomedia.com/blog/go/bible-facebook/

  2. Annick Andres

    Sujet de réflexion inté­res­sant. Mais nous n’avions pas besoin d’une étude en pro­fon­deur pour arri­ver a ce constat. Je m’amuse par­fois a jouer moi-même a ce petit jeu de réseau. 

    Apres tres peu de temps on déniche plein de ren­sei­gne­ments inté­res­sants, sou­vent dévoi­lés a l’insu du prin­ci­pal inté­ressé (ex. endroits qu’il aime fréquen­ter, lec­tures, lieu de rési­dence, nombre d’enfants, d’ex, lieux de récents voyages, etc.). C’est le fameux prin­cipe du trois degrés de sépa­ra­tion maté­ria­lisé devant nos yeux.
    C’est d’ailleurs une des rai­sons pour lesquelles je refuse de m’inscrire a ce type de réseau sur Internet. On est déja assez répertorié !

4 Trackbacks For This Post

  1. Tweets that mention Data mining sur Facebook : ça fait peur | ReadWriteWeb France -- Topsy.com :

    […] This post was men­tio­ned on Twitter by kikis­tan and charly. charly said: Data mining sur #Facebook : ça fait peur http://is.gd/3zepu […]

  2. Data mining sur Facebook : ça fait peur « Cybercriminalité, sécurité des entreprises et ordre public sur Internet :

    […] de déli­vrance des bre­vets Data mining sur Facebook : ça fait peur octobre 9, 2009 Le Data Mining, c’est l’art d’explorer une masse gigan­tesque de don­nées à la recherche de sens, […]

  3. A lire ailleurs #21 septembre - 9 octobre | traffic-internet.net :

    […] . Data mining sur Facebook : ça fait peur | ReadWriteWeb France A l’aide de leurs pro­fils Facebook, un logi­ciel du MIT est capable de pré­dire votre posi­tion­ne­ment poli­tique, votre reli­gion, et même votre orien­ta­tion sexuelle. Pour Hal Abelson, le pro­fes­seur qui a dirigé l’étude, “cela coupe l’herbe sous les pieds de ceux qui affirment que la solu­tion au pro­blème de la vie pri­vée est de don­ner un total contrôle des don­nées aux uti­li­sa­teurs”. En effet, à aucun moment ce logi­ciel n’utilise les don­nées figu­rant sur le pro­fil de la per­sonne étudiée pour faire ses pré­dic­tions, il se contente de par­cou­rir les don­nées affi­chées par ses amis. […]

  4. Critiques du Web² (4/4) : Que faire face à la puissance des données ? | traffic-internet.net :

    […] du projet Gaydar de deux étudiants du MIT qu’évoquait récem­ment le Boston Globe repris par le Read Write Web fran­co­phone. Le projet Gayvatar uti­lise des tech­niques de fouille de don­nées pour déter­mi­ner les […]

Réagissez !

Ils nous soutiennent

feedback2.0

hébergement infogérance BearstechLa Cantine

 

  • A propos
  • Best of
  • Buzzing
  • Tags

ReadWriteWeb est un blog dédié aux technologies internet qui en couvre l’actualité et se distingue par ses notes d’analyse et de prospective ainsi que par l’accent mis sur les usages et leur impact sur les média, la société et la communication.

ReadWriteWeb est classé parmi les blogs les plus influents de la planète par Technorati et Wikio.

ReadWriteWeb est publié en anglais, en français, en coréen, en portugais et en chinois. Ses articles sont publiés dans la rubrique technologie du New York Times.


eBooks

Lawrence Lessig
Culture Libre



Pierre Bellanger
La Radio IP



Nous y serons