Vassilis Kostakos, professeur à l’université Carnegie Mellon, vient de publier une étude qui remet sérieusement en question l’idée de la sagesse des foules (wisdom of crowds), pourtant l’une des grande théorie sur lesquelles se bâti le web d’aujourd’hui.
Son étude regarde de près les modalités de vote sur différents sites de revue d’utilisateurs, dont Amazon, IMDb, et BookCrossing. Les résultats de recherche montrent qu’une petit groupe d’utilisateurs sont responsables de la plupart des votes.
En d’autres termes, comme beaucoup le suspectaient déjà, de petits groupes puissants peuvent aisément déformer ce que la masse pense vraiment, et prendre la direction des systèmes de revue en ligne qui du coup, apparaissent polarisés entre extrêmement positifs et extrêmement négatifs.
Petits groupes, gros impact
Pour mener sa recherche, Kostakos a travaillé avec une échantillon large de notations faites en ligne par des utilisateurs. Comme le rapporte le Technological Review du MIT, le chercheur et son équipe ont étudié des centaines de milliers d’éléments notés et des millions de votes, et ce sur trois sites. Dans chacun des cas, ils ont découvert qu’un petit groupe de votants représentaient l’essentiel des votes.
Par exemple, sur Amazon, seul 5% des utilisateurs actifs d’Amazon ont déjà voté sur plus de 10 produits, mais une petite poignée d’utilisateurs a voté pour plus d’une centaine de produits. Selon Kostakos, “Si vous avez deux ou trois personnes qui votent 500 fois, les résultats ne sont pas du tout représentatifs de l’opinion de la communauté dans son ensemble”.
Ce n’est pas la première fois que la théorie de la sagesse des foules est mise à mal. Le terme, qui sous entend qu’un échantillon vaste d’individus prennent de meilleures décisions et font de meilleures prédictions que des individus seuls ou des experts, a été utilisé dans le passé pour décrire la façon dont tout, de Wikipedia à Digg, offre de meilleurs services sur internet que ce qu’un petit groupe d’individus pourrait faire.
Bien sûr, nous savons aujourd’hui que cela n’est pas vrai. Wikipedia, par exemple, n’est pas du tout écrit et édité par une foule, en pratique, 1% des utilisateurs de Wikipedia sont à l’origine de la moitié des éditions faites sur le site. Même le fondateur de Wikipedia, Jimmy Wales, l’a confessé, estimant le coeur des éditeurs de Wikipedia a un petit groupe de plusieurs centaines d’individus.
Pour ce qui est de Digg (et vraisemblablement de Wikio en France), le site dont l’algorithme est constamment changé et amélioré dans le but d’apporter un peu plus de démocratie aux votes de ses utilisateurs, reste malgré tout dominé par une poignée de power users qui peuvent faire et défaire un lien sur la homepage.
Les tentatives pour résoudre le problème
Il n’est pas surprenant de s’apercevoir que quand on a à faire à des sites de notation, ce sont là encore de petits groupes qui contrôlent tout. Certains site, dont Amazon, tentent de prendre en compte le problème en permettant aux utilisateurs de voter sur l’utilité d’un revues fait par un utilisateur, ce qui est bien plus facile que d’écrire soi même une revue, incitant ceux qui n’en font pas habituellement à participer au processus.
Le moteur de recherche et de notation Yelp a mis en place un système qui permet aux propriétaires de commerces notés dans Yelp de répondre aux commentaires qu’ils ont reçus. Malheureusement, malgré ces fonctionnalités, les petits groupes restent au contrôle de ces sites censés refléter l’opinion des masses.
Un autre professeur de Carnegie Melon, Niki Kittur, suggère que les sites devraient créer de nouveaux outils pour permettre plus de transparence. Par exemple, une façon rapide de voir les contributions de tel ou tel utilisateur, qui mettrait en lumière facilement un parti pris. Il suggère également de retirer purement et simplement les critiques trop positives ou trop négatives.
Plus tôt cette année, nous avons passé en revu un autre site de notation par les utilisateurs qui s’attaquait au problème sous un autre angle. Lunch.com, un concurrent de Yelp, utilise une fonctionnalité appelée “Réseau Similaire” (Similarity Network), qui vous suggère un réseau d’utilisateurs avec des goûts proches des vôtres. De cette façon, plutôt que de regarder à des commentaires et des notations qui seraient en provenance de n’importe qui, et potentiellement de personnes ayant l’intention de biaiser des résultats, vous filtrez pour ne voir que les commentaires de personnes ayants des goûts similaires aux votres.
Il n’existe pas de solutions parfaites au problème, et il est peut être temps de laisser tomber le concept de la sagesse des foules, d’autant que ce concept, naguère réservé aux spécialistes, commence a déborder un peu partout.
La télévision gravement atteinte du virus de la sagesse des foules
Pas un jour ne se passe dans une chaîne info sans une traditionnelle “question internet”. Là encore, on a à faire à une vue parfaitement biaisée, aux mains d’un petit groupe, censée faire office de sondage, et très souvent présenté comme tel, sous l’appellation “sondage internet”, par exemple.
Les blogs et les média en ligne ne sont pas avares, eux aussi, de votes en ligne, et poussent parfois jusqu’à es appeler, eux aussi, sondage.
Ces questions, ou plutôt leurs réponses, ne reflètent en réalité qu’une dangereuse contagion par la télévision et les média, en quête d’astuces pour faire baisser les coûts liés à un sondage, un vrai, et qui a cru voir dans un dispositif simple et peu couteux, une alternative à des sondages dispendieux.
Il y a un an encore, un luxe de précautions étaient prise dans la présentation de tels résultats, mais c’est nettement moins le cas aujourd’hui, et l’opinion publique n’est pas loin de penser que ces chiffres font désormais office de sondage express. En réalité, il n’en est rien, ils sont aisément manipulables, soit par un petit groupe de fidèles utilisateurs, soit par des attaques coordonnées de nouveaux utilisateurs fédérés, par exemple, par Twitter.











28 septembre 2009 à 10:58
Merci pour cette mise au point.
Il ne faut pourtant pas rejeter le web et ce qu’il produit d’un coté, ni la théorie de la sagesse des foules de l’autre. Le web n’est pas le fruit d’un mécanisme telle que ce que l’on appelle “la sagesse des foules” et qui est expliquée par James Surowiecki dans son livre, il est le fruit d’une espèce de fonctionnement intuitif et habituel : la vie.
1% des hommes sont assez savants, travailleurs et généreux pour partager leur savoir. 10% croient être savants et souhaitent le faire savoir, 85% sont bien contents de trouver les choses toutes faites ou s’en fichent et il reste quelques % de nuiseurs qui, en groupe ou seuls, s’activent à introduire du désordre dans ce qui s’organise assez naturellement avec une certaine sagesse naturelle (une forme de la sagesse des foules ??) : le web.
Personnellement, j’apprécie beaucoup le fait que le web produise du très positif et j’ai tendance à y trouver beaucoup d’espoir pour le futur et le genre humain.
Ce fonctionnement que je décris (avec les pourcentages approximatifs que je propose) se retrouve dans toute organisation humaine et notamment les entreprises. Les meilleures d’entre elles devant plus à leur leader (capacité à entrainer, choisir les bons produits, gérer les concurrents, …)qu’à leur “foule” de collaborateurs.
Donc la sagesse des foules, la capacité a faire intuitivement un bon choix parmi plusieurs possibilités existantes, n’a rien à voir avec l’enrichissement du web par quelques passionnés courageux, mais chacun des deux sujets mérite un moment d’attention.
Cdt
28 septembre 2009 à 11:03
Un truc qui me chiffonne dans ces études c’est qu’en isolant les éléments les uns des autres (amazon par exemple) j’ai l’impression qu’elles oublient le principe du réseau propre à internet.
Si je cherche un produit quelconque sur amazon je vais certes consulter les notes, mais aussi demander un avis sur un forum spécialisé, lire le blog de machin spécialiste du produit quelconque, demander un avis à mon réseau perso (facebook ou twitter), etc. C’est peut être dans la synthèse de tous ces éléments que s’exprimera “la sagesse des foules”.
28 septembre 2009 à 11:06
Pas du tout, l’étude au contraire se borne à montrer cela, la sagesse des foules ne fonctionne pas sur un seul site. Une fois que tout le monde est plus ou moins conscient de cela, il ne reste qu’à adopter ce que tu décris, ne pas s’arrêter à un site, faire de l’aggrégation et s’ouvrir à l’avis de différentes communautés.
28 septembre 2009 à 14:19
Merci pour votre article.
C’est toujours très intéressant de remettre en cause le pré-requis de “sagesse des foules” et votre article souligne parfaitement le biais potentiel qui peut survenir si un petit groupe exerce un levier suffisant sur la masse.
Un point pour ouvrir le débat :
Connaissez-vous le paradoxe d’Abilene, souligné par le sociologue Jerry Harvey, qui mets en lumière qu’une décision de groupe peut être absolument opposée à la décision individuelle de chacun, composant le groupe.
Ce qui tend à dire qu’en en limitant le nombre d’individus d’un groupe, ne tendons-nous pas à augmenter le consensus d’une décision?
JN
28 septembre 2009 à 14:24
http://fr.wikipedia.org/wiki/Paradoxe_d%27Abilene
Non, je ne connaissait pas… ceci dit, on parle d’un petit groupe, du coup, et pas des foules…
28 septembre 2009 à 15:43
Sarah, Fabrice, pour ce qui concerne Wikipedia, il me semble que vous n’avez pas lu l’article que vous citez jusqu’au bout :P
Dans http://www.aaronsw.com/weblog/whowriteswikipedia , Aaron Swartz complète utilement l’affirmation de Jimbo Wales par les résultats de son étude : si un tout petit nombre de personnes est en effet responsable d’un très grand nombre d’éditions, un très grand nombre de personnes est responsable de la majorité du contenu.
Autrement dit le noyau s’occupe de la maintenance Wikipedia par des éditions petites et nombreuses (annulation du vandalisme, renommage, mise en forme), tandis que le contenu lui-même est fait par … la foule.
28 septembre 2009 à 15:46
L’étude ne porte pas du tout sur wikipedia mais sur les sites de Rating, Wikipedia est un cas à part en effet, l’ultra spécialisation nécessaire à l’écriture d’un article rend son fonctionnement particulier.
Là, on parle de sites qui ne nécessitent pas une expertise particulière pour susciter la participation d’une communauté : faire une critique d’un film sur IMDB, d’un restaurant sur Yelp, des choses comme ça…
28 septembre 2009 à 15:53
Oui, mais vous prenez Wikipedia en exemple pour appuyer votre thèse dans ce § :
“Bien sûr, nous savons aujourd’hui que cela n’est pas vrai. Wikipedia, par exemple, n’est pas du tout écrit et édité par une foule, en pratique, 1% des utilisateurs de Wikipedia sont à l’origine de la moitié des éditions faites sur le site. Même le fonda teur de Wikipedia, Jimmy Wales, l’a confessé, estimant le coeur des éditeurs de Wikipedia à un petit groupe de plusieurs centaines d’individus.”
Fallacieux non ?
28 septembre 2009 à 15:54
Pas faux, oui… on est un poil hors contexte de l’étude en effet…
28 septembre 2009 à 21:49
Je trouve le titre un peu provoquant.
Ce que prouve l’article est simplement que ce n’est pas une foule qui vote ou donne son avis mais un petit groupe. Ce petit groupe peut orienter l’opinion.
En fait, on ne prouve rien sur la sagesse d’un grand nombre.
Est-on plus sage à plusieurs ou individuellement ?
29 septembre 2009 à 1:45
Ce n’est pas une nouveauté.
Mais pour moi, l’analyse ne va pas assez loin car elle ne prend pas en compte certains phénomènes.
D’abord, tout le monde peut joindre le groupe. Et les gens le feront d’autant plus que le groupe ne va pas dans le sens qu’ils souhaitent.
Bref, il existe probablement une grande population silencieuse car d’accord avec le groupe. La fameuse majorité silencieuse de sarkozy. Mais plutôt que de l’utiliser à tort et à travers pour justifier toutes sortes de lois, on la constate en action ici.
Pour prendre l’exemple de RWweb, il existe probablement beaucoup de lecteurs qui ne postent pas de commentaires. Faites un article qui prône des idées contraires à tout ce que pensent ces lecteurs et vous verrez qu’une partie d’entre eux va se mettre à participer.
Bref, la foule n’est pas grande, mais qu’en est-il de la foule qui surveille la foule ?
29 septembre 2009 à 16:07
Un autre exemple de sagesse biaisée des foules est l’expérience qu’à mené le constructeur DELL pour réunir les avis de ses clients. Il en est ressorti que la principale demande était de fournir des PC DELL avec Linux préinstallé.
Résultat, DELL ne propose plus de PC Linux, à l’exception et des notebooks.
La communauté Linux a tout simplement été la plus active, mais pas la plus représentative.
01 octobre 2009 à 7:49
hadf > Je crois que tu sous estime un point : les versions linux étaient vendues sensiblement au même prix que les version windows. Mais ceci est un atre débat.
Bref, ton exemple ne me semble pas pertinent, ou au moins trop sujet à cautions.
05 octobre 2009 à 22:07
fabrice
et ce que ce genre de reco que je trouve très amusant et intriguant ( est ce que cela marche???)
a été étudié par l’étude
http://en.wikipedia.org/wiki/Habrahabr.ru
à plus
jy
05 octobre 2009 à 22:16
intéressant comme système… je découvre, jamai entendu parler d’un système d’auto régulation aussi complexe. J’ignore totalement si ça marche.
08 octobre 2009 à 3:02
Désolé mais je ne vois pas le lien entre la sagesse des foules et des systèmes de notation type amazon ou des sondages bidons. Sur amazon, je lis le contenu des commentaires et non uniquement le nombre d’étoiles.
Ce que ce billet montre, c’est qu’il n’y a pas foule et donc s’il n’y pas foule, il n’y a forcément pas sagesse des foules. Ce dont il est question c’est de groupes de personnes plus actives que les autres sur certains sites (e-commerce ou TV).
08 octobre 2009 à 15:43
Ca s’applique aussi aux commentaires j’en ai peur…
http://www.lesechos.fr/info/analyses/020162406464-une-minorite-fait-l-opinion-sur-le-web.htm