11 mises au point à propos du web sémantique

1. Inutile de s’excuser de l’appeler Web 3.0. Bien sûr, le web ne se met pas à jour à la façon d’une entreprise qui passerait sous Vista, mais il y a une claire transition par rapport aux technologies en usage aujourd’hui. Pour faire simple, on pourrait dire que le Web 3.0 est l’alliance de la capacité de collaboration massive engendrée par le Web 2.0 (le web social) et de sources de données structurées.

 

2. Le web sémantique est le début de la fin des bases de données relationnelles (comme mySQL). Le Web 3.0 permet la transition entre des données structurée « à la base » et des données structurées « à la volée ». Le monde est bien trop complexe pour être structuré à la base, malgré les efforts et le talent des experts en modélisation de base de données, c’est une tâche impossible (et quelque peu absurde d’un point de vue philosophique). Structurer les données à la volée est fait par des utilisateurs sur un mode collaboratif (le geotagging de Flickr, par exemple) ou par des machines qui structurent automatiquement des données brutes (comme OpenCalais).

Structurer les données à la volée est quelque chose de particulièrement complexe (c’est un euphémisme), et les bases de données relationnelles sont omniprésentes : la transition sera donc lente, très lente, mais leur déclin est inévitable.

L’innovation a sérieusement ralenti dans le monde des bases de données relationnelles (avec l’open source d’un coté et Oracle de l’autre, le terrain n’est pas favorable) le web sémantique, lui, est l’un des secteurs les plus innovant du web d’aujourd’hui.

Les bases de données relationnelles étaient taillées pour l’entreprise, capable de faire face aux besoins des plus grosses multinationales, mais le web et ses centaines de millions d’utilisateurs est un challenge autrement plus important qu’elles ont le plus grand mal à affronter. Devinez ce qu’utilise Amazon pour ses données, vous aurez une idée des technologies aptes à affronter le web de demain, celui dont la Chine et l’Inde seront les principaux utilisateurs, et dont les utilisateurs se compterons en milliards.

 

3. Si vous êtes un expert des technologies sous jacentes au web sémantique, si des termes comme RDF, OWL, Tuple et Sparql ne vous font pas mal à la tête, vous serez en mesure dans les années à venir de faire grimper vos tarifs de consultant de façon indécente, car il existe peu d’experts en la matière. Mais profitez-en vite, car une startup aura vite fait de trouver un moyen de rendre tout cela accessible au plus grand nombre pour un prix dérisoire.

 

4. Les réussites du web 3.0 seront différentes de celles que l’on a connu à l’époque du web 2.0, tout comme les succès du web 2.0 sont différents de ceux du web 1.0. Les succès du web 2.0 reposaient principalement sur une fonctionnalités unique (partage de photo, bookmarks, hébergement vidéo, plateforme de blogs…) et un recrutement particulièrement rapide d’utilisateurs.  Le web sémantique est intrinsèquement basé sur l’intégration de services, ce sera différent, plus lent, mais avec un potentiel bien plus grand.

 

5. Ne cherchez pas systématiquement la killer app. Ce concept repose sur la rencontre heureuse d’une offre et d’utilisateurs. Les succès de demain sont plus à observer, sous leur forme embryonnaire, dans une combinaison serveur/platforme/entreprise gagnante, même si l’expérimentation initiale a lieu sous la forme d’une offre grand public, c’est du coté du B2B que le web sémantique a le plus de potentiel (ce qui est, en parti, la façon dont Microsoft justifiait le rachat de Powerset il y a peu). Freebase, par exemple, ressemble objectivement plus à la phase pré-beta d’une offre – profondément disruptive – de « base de donnée sémantique » pour entreprise qu’à un service grand public.

 

6. Dans la mesure où les offres de base du web sémantique seront vraisemblablement des plateformes, la puissance de leurs APIs est l’une des clés du succès. Inciter des startups à construire des applications innovantes sur la base d’une plateforme « sémantique » nécessite une API puissante et une capacité à générer de nouveau modèles  de revenus, voir un véritable écosystème. Ces applications peuvent être grand public ou destinées à l’entreprise, la seule limite à cela est l’imagination des entrepreneurs. (Là encore, OpenCalais est un exemple prometteur)

 

7. Le web sémantique pourrait marquer la fin de la croissance sans limite de Google, tout comme le PC pour IBM et le web pour Microsoft. Pour l’instant, l’ascension de Google semble sans limites, et ils excellent à la soutenir en complétant leur offre d’une façon assez efficace, mais « les arbres ne montent pas au ciel » et quelque chose de nouveau vient toujours en travers des succès les plus éblouissants. Google a excellé à rendre relativement structuré les données chaotiques de milliards de pages html non structurées. Le web sémantique rendra cette capacité de moins en moins critique au fur et à mesure que ces pages deviendront elles même de mieux en mieux structurées (tags, microformats, etc). Ces grandes transitions générationnelles – du mainframe au PC, du PC au web – ont lieu de plus en plus rapidement, et il semble que le moment soit venu pour qu’une nouvelle transition disruptive ait lieu.

 

8. Inutile d’espérer qu’un moteur de recherche sémantique joue avec succès à David contre Goliath avec Google. Tout comme le PC n’est pas un mainframe, le web n’est pas un PC, et le web sémantique n’est pas Google. Inutile non plus de me demander à quoi le web sémantique pourrait ressembler, je serais obligé de vous faire disparaitre après vous l’avoir dit, par contre, je peux vous dire à quoi il ne ressemble pas.

 

9. Les moteurs de recherche verticaux sont une approche pragmatique du web sémantique, ils utilisent une multitude de technologies – moteur de recherche, APIs, scrapers, éditeurs humains… – pour créer un écosystème d’informations utiles dans un domaine précis. A terme, cette multitude de solutions pragmatiques sera remplacée par une véritable plateforme sémantique, et plus concrètement par une API qui permettra à des éditeurs humains de mettre en valeur leur expertise dans un secteur. Cette future plateforme pourrait émerger de l’un de ces moteurs de recherche verticaux.

 

10. Le tagging est un usage/une technologie totalement disruptive. Tout le monde taggue. Quoi de plus naturel que d’attribuer du sens, de classer et de cataloguer ce que nous découvrons ? Nous le faisons tous depuis notre plus tendre enfance, et le tagging n’est qu’une extension de cette capacité humaine qui est à la base de notre intelligence et de notre créativité. Nous le faisions avec des dossiers dans Windows, nous le faisons désormais avec nos bookmarks dans Delicious. Nous sommes au tout début de quelque chose de très important dans l’Histoire de l’information.

 

11. Le web sémantique utilisera le web social (web 2.0) et sa capacité à la collaboration massive pour ajouter de la structure à l’information. Mais il y a peu de chances que le web sémantique émerge d’un des sites « web 2.0 » actuels. Les gagnants seront ceux qui fourniront des outils transformant une tâche pénible et ennuyeuse comme la structuration d’information en quelque chose de ludique et facile. C’est la grande leçon que le Web 3.0 a à tirer du Web 2.0, et c’est quelque chose à coté duquel Yahoo, à travers Delicious semble être passé.

[adaptation d'un article de Bernard Lunn]

A lire également :

  1. Les moteurs de recherche sémantiques ont-ils besoin d’une carte sémantique ? ...
  2. Cognition lance la “plus grande carte sémantique au monde” ...
  3. Google se met-il au web sémantique ? ...
  4. Un ciblage plus précis de la pub grâce à la sémantique ...
  5. Le manifeste du Web 3.0 est sorti ...
  6. SematicProxy : le signal de départ du web sémantique ? ...
  7. Zemanta rend visible le web sémantique ...

0 commentaires pour cet article

1 Trackbacks For This Post

  1. links for 2009-09-07 « Ikan66 :

    […] 11 mises au point à pro­pos du web séman­tique | ReadWriteWeb France (tags: web sémantique) […]

Réagissez !

Ils nous soutiennent

feedback2.0

hébergement infogérance BearstechLa Cantine

 

  • A propos
  • Best of
  • Buzzing
  • Tags

ReadWriteWeb est un blog dédié aux technologies internet qui en couvre l’actualité et se distingue par ses notes d’analyse et de prospective ainsi que par l’accent mis sur les usages et leur impact sur les média, la société et la communication.

ReadWriteWeb est classé parmi les blogs les plus influents de la planète par Technorati et Wikio.

ReadWriteWeb est publié en anglais, en français, en coréen, en portugais et en chinois. Ses articles sont publiés dans la rubrique technologie du New York Times.


eBooks

Lawrence Lessig
Culture Libre



Pierre Bellanger
La Radio IP



Nous y serons