Les moteurs de recherche sémantiques ont-ils besoin d’une carte sémantique ?

Cette semaine, nous annoncions la sortie par Cognition de la « plus grande carte sémantique de la langue anglaise ». Au cours de l’interview que nous a accordé Scott Janus, le CEO de Cognition, nous lui avons demandé de comparer sa technologie avec celle de Hakia et PowerSet, deux autres acteurs de la recherche sémantique. Janus avait alors pointé du doigt que sa carte sémantique était le principal élément différenciateur, ajoutant qu’aucun moteur de recherche sémantique ne pouvait prétendre au succès sans une carte sémantique complète.

Est-ce exact ? Nous avons demandé le point de vue de Hakia et Powerset

Cognition revendique une carte sémantique couvrant plus de 10 millions de connections sémantiques, dont plus de 4 millions de contextes sémantiques (des mots qui impactent la signification d’autres mots environnants).

Riaz C. Berkan, le CEO de Hakia rétorque que Hakia propose une « sémantique ontologique (OntoSem) », qu’il décrit comme un « réseau de concepts reflétant une ontologie ». Il ajoute que Hakia comprend plus d’un million de mots anglais.

Ceci dit, Berkan note que la taille d’une carte sémantique n’est pas nécessairement d’une importance capitale : « la taille absolue d’une collection de mots ou de concepts ne représente en aucun cas les capacités d’un système ». Pour Hakia, il n’y a pas de « formule magique » pour faire d’un moteur de recherche sémantique un succès, à partir du moment ou le système est capable de monter en charge et qu’il a un minimum de dépendance aux ‘mots’.

Voilà qui ne nous éclaire guère… Le terme employé par Cognition, « Carte Sémantique », et qui est censé être indispensable, n’est pas utilisé par Hakia, et nous leur avons demandé de nous préciser s’il utilisaient ou non une telle carte. Christian Hampelmann, le « Chief Scientific Officer » de Hakia nous a répondu par email en ces termes :

« Ce terme (carte sémantique) est parfois utilisé dans le cas d’intégration de données, mais ce n’est pas un terme utilisé en linguistique. Peut être s’agit-il de ce qui est communément appelé ‘ontologie’. Si on s’en réfère à leur site web, Cognition n’utilise que deux types de relations, un peu comme WordNet : l’hyperonymie (e.g. les chat sont des félins, les félins sont des mammifères; c’est leur taxonomie), et les synonymes (e.g. « acheter » signifie presque la même chose que « acquérir »; c’est leur thésaurus). Qui plus est, leur carte est intrinsèquement liée à la langue anglaise et reste inutilisable pour une autre langue. Hakia, de son coté, a des ontologies avec beaucoup plus de relations, donnant à notre « carte sémantique », s’il faut l’appeler ainsi,  plus de puissance; elle est, qui plus est, utilisable et déjà utilisé dans d’autres langues. »

Nous cherchons toujours une réponse de PowerSet qui pour l’instant n’a pas répondu à nos emails.

Tout cela éclaire-t-il la définition de ce qu’est une carte sémantique ? Simple terme marketing introduit par Cognition ou véritable avancée ? Pas évident… Si vous avez un avis, n’hésitez pas à commenter…

(adapté d’un billet de Richard MacManus)


Recommandez cet article à vos amis

et rejoignez nous sur Facebook et Twitter...



Les commentaires sont fermés.

  • A propos
  • Best of
  • Buzzing
  • Tags

ReadWriteWeb est un blog dédié aux technologies internet qui en couvre l’actualité et se distingue par ses notes d’analyse et de prospective ainsi que par l’accent mis sur les usages et leurs impacts sur les média, la communication et la société. Il est classé parmi les blogs les plus influents de la planète par Technorati et Wikio. Publié en cinq langues, il s'appuie sur un réseau de correspondants locaux en Nouvelle-Zélande, aux Etats-Unis, en France, en Espagne, au Brésil, en Chine ainsi qu'en Afrique francophone. Ses articles sont publiés dans la rubrique technologie du New York Times.


Partenaires

hébergement infogérance Bearstech
ATLN Association Tunisienne pour les Libertés Numériques

af83



Tunisie média

Appli iPhone


 

Recommandés



Activité sur le site