SematicProxy : le signal de départ du web sémantique ?

Malgré son immense potentiel, le web sémantique n’a pas pour l’instant donné grand chose. L’une des raisons au problème, à en croire Thomson Reuters, est que les développeurs n’ajouterons pas de fonctions sémantiques à leurs produits tant que les éditeurs de contenus ne publieront pas de données sémantiques. Une affaire classique de poule et d’œuf. OpenCalais était déjà une façon de répondre au problème, mais à partir d’aujourd’hui, le nouveau projet de Reuters, SemanticProxy va donner aux développeurs un moyen encore plus simple d’incorporer des données sémantiques à leurs sites web.

Bien que destiné aux développeurs, Reuters a créé un site de démonstration utilisable par tous en y copiant tout simplement l’adresse url d’un site dans un simple formulaire.

Nous avons testé cette technologie avec différents types de contenus, issus de CNN, Wikipedia ou de divers blogs, et les résultats ont toujours été particulièrement pointus et précis. Le service est optimisé pour fonctionner avec les principaux site d’information, mais il fait des merveilles avec n’importe quel site, pour peu que les contenus soient en anglais et que le texte à analyser ne soit pas trop long.

Pour une actualités, par exemple, SemanticProxy identifiera les politiciens impliqués, les villes, pays, etc., qui sont mentionnés dans l’article. Une fois le texte analysé, le système fournit les données sémantiques de la page sous trois formats au choix : RDF, Microformats ou un classique html.

Comme son nom l’indique, SemanticProxy agit comme un proxy et garde en cache ses données, ce qui devrait assurer des performances permettant à tout développeur de se reposer sur un tel service pour leurs projets sans crainte de voir le système s’écrouler.

Un rôle de catalyseur

SemanticProxy fait parti des initiatives prises par Reuters pour donner enfin vie au web sémantique. Comme le souligne Tom Tague, le leader du projet Calais chez Reuters, SemanticProxy pourrait catalyser bien des projets et contribuer a créer de nombreuses données sémantiques sur le web, ce qui devrait en retour inciter les développeurs à créer des systèmes qui les manieraient à leur tour.

(Disclosure : Calais/Reuters est sponsor de ReadWriteWeb)

(adapté d’un billet de Frederic Lardinois)

A lire également :

  1. Google se met-il au web sémantique ? ...
  2. Cognition lance la “plus grande carte sémantique au monde” ...
  3. Les moteurs de recherche sémantiques ont-ils besoin d’une carte sémantique ? ...
  4. 11 mises au point à propos du web sémantique ...
  5. Un ciblage plus précis de la pub grâce à la sémantique ...
  6. Zemanta rend visible le web sémantique ...
  7. Siri, une startup (discrète) du web sémantique lève 8,5 millions de dollars ...

0 commentaires pour cet article

2 Trackbacks For This Post

  1. Bit.ly et Twitter dessinent l’avenir du lien | ReadWriteWeb France :

    […] et plein d’autres choses encore. En pra­tique, pour réa­li­ser cela, Bit.ly tra­vaille avec Open Calais, une tech­no­lo­gie qui, en gros, applique auto­ma­tique­ment des tags à vos conte­nus. Propriété de […]

  2. Du web 2.0 au web 3.0 en passant par les médias sociaux et l’intagable Web Squared : :: Nues Blog par Nicolas Voisin :: :

    […] web social, web des don­nées, web du lien, (des don­nées et des liens) web temps-réel, web séman­tique (on en dis­cu­tais ici à pro­pos de ReutersCalais) se cherche un nom, une défi­ni­tion, une […]

Réagissez !

Ils nous soutiennent

feedback2.0

hébergement infogérance BearstechLa Cantine

 

  • A propos
  • Best of
  • Buzzing
  • Tags

ReadWriteWeb est un blog dédié aux technologies internet qui en couvre l’actualité et se distingue par ses notes d’analyse et de prospective ainsi que par l’accent mis sur les usages et leur impact sur les média, la société et la communication.

ReadWriteWeb est classé parmi les blogs les plus influents de la planète par Technorati et Wikio.

ReadWriteWeb est publié en anglais, en français, en coréen, en portugais et en chinois. Ses articles sont publiés dans la rubrique technologie du New York Times.


eBooks

Lawrence Lessig
Culture Libre



Pierre Bellanger
La Radio IP



Nous y serons