ReadWriteWeb French edition » Alexander Korth http://fr.readwriteweb.com Libertés numériques, innovations disruptives, et trucs digitaux en tout genre Tue, 07 Feb 2012 23:21:47 +0000 en hourly 1 Le Web des Identités : Permettre aux machines d’accéder à vos données http://fr.readwriteweb.com/2009/11/05/analyse/web-des-identits-permettre-aux-machines-daccder-vos-donnes/ http://fr.readwriteweb.com/2009/11/05/analyse/web-des-identits-permettre-aux-machines-daccder-vos-donnes/#comments Thu, 05 Nov 2009 09:28:07 +0000 Alexander Korth http://fr.readwriteweb.com/?p=6262

Dans un article précédent, nous avons abordé le Web des Données, dont le principe repose sur l’interconnexion de jeux de données qui permet de rendre des données structurées accessibles aux machines. Dans cet article, nous allons voir comment le Web social qui est en train d’émerger peut donner lieu à un Web d’Identités, qui est en clair un Web des Données appliqué aux personnes.

Le projet Linking Open Data soutenu par le W3C a été pas mal médiatisé grâce à ses avancées avec le Web des Données. Actuellement, toutes les bases de données qui participent au projet sont accessibles gratuitement et peuvent être réutilisées sans contraintes. Le projet se concentre avant tout sur sa croissance aujourd’hui. Dans un email, Chris Bizer a fait allusion à un éventuel modèle économique qui ferait payer l’accès à certain contenu.

L’approche du LOD est très pertinente pour du contenu statique ou du savoir encyclopédique, mais qu’en est-il de nos données personnelles ? Techniquement, modéliser notre identité, nos données de profiles, notre graphe sociale, nos groupes, notre flux d’activités et autres types de données personnelles est simple. Mais donner aux machines la capacité d’accéder à ces données n’est pas si simple à intégrer dans l’approche du LOD, parce qu’il y a toute une série de contraintes et de différences, telles que des paramètres de vie privée et de volatilité des données. Les utilisateurs veulent contrôler qui a accès à leurs données ou certaines parties de leurs données, et veulent être capables d’en bloquer l’accès pour n’importe quelle raison. Et des problèmes dus aux changements rapides et à l’obsolescence de ces données restent sans réponses.

C’est là que le Web social peut intervenir.

Le Web social émergeant

Il y a eu une époque où nous devions créer une nouvelle identité digitale pour chaque application sociale que nous voulions utiliser. Une application sociale fournit des services en rapport avec nos attributs sociaux. Chaque développeur d’applications mettait en place son système propriétaire de gestion des identités pour permettre aux utilisateurs de s’identifier, et créait son système propriétaire de gestion des données des utilisateurs. Les développeurs d’applications étaient jugés sur le  nombre d’utilisateurs et la quantité de données qu’ils possédaient si bien que chacun défendait son petit pré carré.

Les problèmes les plus évidents qui se produisaient alors étaient :

  • Des faibles taux de conversion pour l’enregistrement de nouveaux utilisateurs,
  • Les utilisateurs devaient créer plusieurs comptes,
  • Les utilisateurs devaient réentrer et synchroniser leurs données de profiles,
  • Des problèmes de vie privées, des possessions des données et d’incapacité à les exporter.

Malheureusement, pas beaucoup a changé depuis cette époque. Le fait le plus remarquable, peut-être, est le nombre croissant de services d’Identification Unique (SSO ou Single Sign-on) qui résout le premier problème pour les fournisseurs d’applications et le deuxième problème pour les utilisateurs.  De nouveaux développeurs d’applications peuvent externaliser cette fonctionnalité à une tiers fournisseur d’une solution de SSO. Les plus gros fournisseurs d’applications sont eux-mêmes devenus des fournisseurs d’identités en autorisant leurs utilisateurs à s’identifier avec le même identifiant sur des applications développées par des tiers.  C’est un phénomène qui s’est répandu assez vite au sein de ces quelques gros fournisseurs et qui a déclenché une véritable guerre des identités.

Au cours des années, beaucoup de fournisseurs d’identités, comme Google, Yahoo !, MySpace et Facebook ont ajouté le SSO OpenID en plus de leurs propres mécanismes d’identification.  En raison de la nature ouverte d’OpenID, beaucoup de fournisseurs indépendants ont trouvé séduisant d’intégrer les gros fournisseurs pour élargir leur audience, car il est très facile pour les utilisateurs de s’authentifier en utilisant OpenID. Aujourd’hui, ces fournisseurs d’identités autorisent un accès en mode « lecture » de certains fragments des données de profiles que les utilisateurs peuvent seulement consulter ou copier dans des applications tierces. Comme SSO et OpenID au début, cela a commencé avec des solutions propriétaires, mais aujourd’hui des formats et des protocoles ouverts d’échanges voient le jour, autorisant les applications à échanger et à synchroniser leurs données. Il y a entre autres :

  • L’API d’identification OAuth,
  • Le format d’échange des graphes sociaux FOAF (« Friend of a friend »),
  • Un format d’échanges des mises à jours de statuts Activity Streams,
  • Un format d’échange de contacts Portable Contacts.

Dans le futur, les fournisseurs d’identités vont aller plus loin que le simple graphe social en autorisant la gestion d’attributs sociaux. Les utilisateurs pourront alors s’identifier sur des applications utilisant le système de leur fournisseurs d’identités de leur choix et pourront donner la permission à ces applications de lire ou même de synchroniser certains fragments de leurs profiles. Les frontières entre ces prés carrés vont alors s’estomper, et le Web social passera du patchwork qu’il est aujourd’hui à une véritable toile.

Le Web des Identités

Le Web des Données est un web décentralisé de jeux de données sémantiquement balisées. Une connexion est en réalité des données pointant vers d’autres données contenues dans une autre base par l’intermédiaire d’URIs, de la même manière que des sites pointent entre eux au moyen d’URIs. De cette manière, les machines peuvent consulter des jeux de données. De même, il y a de très fortes chances que les fournisseurs d’identités fassent référence à leurs utilisateurs  via des URIs. Une connexion sociale sera donc le résultat de l’URI d’un utilisateur pointant vers l’URI d’un autre utilisateur ou  fournisseur d’identités. Si l’utilisateur l’autorise, une machine pourrait donc accomplir des tâches en consultant successivement des profiles d’utilisateurs disponibles sur le Web des identités, de la même manière qu’elle le fait pour le Web des données.

Pourquoi en a-t-on besoin ? Les Web des identités est en fait un gigantesque graphe social qui englobe plusieurs fournisseurs d’identités. Si nous en finissons avec les prés carrés, nous aurons besoin d’une telle infrastructure pour effectuer toutes les recherches avec une dimension sociale. Voici quelques exemples de ce qui serait rendu possible :

  • « Quel est le meilleur livre que mon cercle d’amis a lu ? » : Cette requête pourrait aller chercher les achats de livres et les statuts de vos amis en lien avec des livres que vos amis ont rendu accessibles via des réglages de vie privées et ont classé dans leurs bases de données de livres.
  • « Prévenez-moi si certains de mes bons amis passe par Berlin » : Cette tâche permanente irait régulièrement consulter les géolocalisations de vos amis. Vous pourriez aussi autoriser vos amis à accéder à vos données. Cette tâche pourrait être couplée au Web des Données pour comprendre le sens de et la localisation de Berlin.
  • « Synchroniser mon carnet d’adresse » : Cette tâche permanente pourrait synchroniser en permanence tous les numéros et adresses de mes amis avec mon carnet d’adresse personnel.

Maintenant, c’est à vous ! A votre avis, quels services pourraient voir le jour grâce au Web des Identités et au Web de Données ?

]]>
http://fr.readwriteweb.com/2009/11/05/analyse/web-des-identits-permettre-aux-machines-daccder-vos-donnes/feed/ 5
Le Web des Données : Rendre l’information compréhensible par des machines http://fr.readwriteweb.com/2009/10/29/analyse/le-web-des-donnees-information-comprehensible-machines/ http://fr.readwriteweb.com/2009/10/29/analyse/le-web-des-donnees-information-comprehensible-machines/#comments Thu, 29 Oct 2009 07:40:23 +0000 Alexander Korth http://fr.readwriteweb.com/?p=6159

Dans les prochaines années, nous serons témoin d’une révolution dans la capacité des machines à accéder, retraiter et utiliser l’information. Cette révolution sera due essentiellement à 3 tendances liées au Web Sémantique : le Web des Données, le Web des Services et le Web des Identités. Ces Webs ont pour objectif de rendre disponibles, accessibles et utilisables le savoir sémantique concernant des données, les services sémantiques, et le savoir sémantique concernant des individus. Dans cet article, nous allons explorer le premier des ces 3 Webs, le Web des Données, et voir comment rendre l’information accessible par des machines transformera la manière de trouver l’information.

La quantité d’informations et de services disponibles croit de manière exponentielle. Chaque jour, il devient de plus en plus difficile de trouver l’information que nous essayons de chercher. Le problème est que nous devons apprendre à dire aux machines ce que nous voulons. Pourquoi une machine ne peut pas comprendre quel site, quel tweet récent, quelle photo sur Flickr, quel message sur Facebook, ou quel restaurant nous cherchons sur Internet?

Parce qu’elle ne peut pas. Elle ne le comprend pas et ne pas accéder à la plupart des sources. Il lui manque la compréhension sémantique et le sens commun pour construire des ponts entre l’information.

Il est essentiel que les machines accèdent à un niveau supérieur de compréhension. Au lieu de faire des analyses statistiques sur  la concordance entre une recherche et un document, une machine doit littéralement être capable de comprendre. C’est pourquoi, des bases de données du savoir sont nécessaires pour s’assurer que nous parlons bien la même entité. Des exemples de ces bases de données sont :

  • Une encyclopédie contenant du savoir permettant de comprendre le sens et le contexte sémantique d’un terme en particulier. Par exemple, comprendre que Berlin est une ville, combien de personnes vivent dedans, et où elle est située.
  • Les pages jaunes ou un ensemble de services pour obtenir des informations plus complexes qui changent régulièrement. Par exemple, la route entre Berlin et Porto en voiture, la température actuelle de Porto en degré Celsius.
  • Une base de donnée des personnes pour avoir accès, avec un jeu de règles de permissions, aux informations d’une personne qui pourrait permettre d’améliorer les systèmes de personnalisation et de recommandation.

Le Web de Données

L’idée du Web de Données tire son origine du Web sémantique. Des gens cherchaient à résoudre le problème de l’incapacité inhérente aux machines de comprendre une page web. Au début, le but du Web sémantique était d’annoter de manière invisible les pages web avec un ensemble de méta attributs et catégories pour permettre aux machines d’interpréter du texte et de le mettre en contexte. Cette approche n’a pas fonctionné parce qu’elle était trop compliquée à mettre en œuvre par les personnes sans savoir technique.  Des approches similaires, comme les microformats, simplifient le processus de balisage et permettent de s’en sortir avec ce problème.

Ces approches ont en commun l’effort d’améliorer l’accessibilité des machines au savoir contenu dans des pages webs qui ont été conçues pour être consultées par des hommes. D’autre part, ces sites contiennent beaucoup d’informations qui ne sont pas pertinentes pour les machines et qui doivent être filtrées. Ce dont on a besoin est une base de données faite pour être consultable par des machines, c’est-à-dire dépouillée d’informations non pertinentes. Mais attention ! Qui a dit que les machines et nous les humains devions partager un seul web ?

L’idée du Web des Données est donc apparue pour contourner les problèmes dus à cette limitation et à l’existence de bases de données structurées colossales réparties dans le monde entier et contenant tous types d’information. Ces données sont la propriété d’entreprises qui les ouvrent de plus en plus. Généralement, une base données contient des informations a propos d’un domaine en particulier, comme les livres, la musique, les données encyclopédiques, les entreprises etc… Si ces données étaient interconnectées (c’est-à-dire pointeraient entre elles comme les sites internet le font), une machine pourrait circuler dans ce web de données « sans bruit » et d’informations structurées pour réunir du savoir sémantique concernant n’importe quel entité ou domaine. Le résultat d’une telle approche pourrait être une base de données gigantesque, totalement gratuite, qui pourrait être les fondements d’une nouvelle génération d’applications et de services.

Lier des données ouvertes

Le projet Linking Open Data(LOD ou Liaison de Données Ouvertes) soutenu ar le W3C est une approche prometteuse. L’image au-dessus illustre l’ensemble des bases de données participant au projet. Les jeux de données sont fait de manière à réutiliser des ontologies existantes telles que WordNet, FOAF, et SKOS et à les interconnecter.

Les jeux de données offrent toutes un accès leur base de données et pointent vers des entrées contenues dans d’autres jeux de données. Le projet suit les principes élémentaires qui régissent le World Wide Web : simplicité, tolérance, conception modulaire et décentralisation. Le projet LOD comporte aujourd’hui plus de 2 milliards de triplets RDF, ce qui représente beaucoup d’information (un triplet est une brique d’information constituée d’un sujet, d’un prédicat et d’un objet  et qui permet de représenter les propriétés d’un objet ou ses relations avec d’autres sujets). De plus, le nombre de jeux de données participant au projet croit très vite. On peut accéder aux jeux de données par différents moyens : par exemple, via un navigateur internet sémantique, ou en étant indexés par des moteurs de recherche sémantiques.

Pour avoir un bref aperçu du Web de Data, vous pouvez cliquer sur les liens suivants :

Avec toutes les données présentes sur le Web des Données, un savoir qui va du très général au très spécifique est accessible aux machines qui permettra l’avènement d’une nouvelle génération de services. Des requêtes très sophistiquées deviendront compréhensibles par des machines et accessibles à la prochaine génération de moteurs de recherche.

Regardez la vidéo de Tim Berners-Lee lors d’une conférence TED sur le Web des Données. Qu’en pensez-vous ? Vous aussi avez-vous le sentiment d’être noyé par l’information ?

]]>
http://fr.readwriteweb.com/2009/10/29/analyse/le-web-des-donnees-information-comprehensible-machines/feed/ 4