La vidéo surveillance de demain s’invente aujourd’hui

brazil videosurveillanceAu delà du débat, si tant est qu’il y ai matière à débat, de savoir si la vidéosurveillance a un quelconque impact sur la délinquance, il serait opportun de se demander si, comme pour Hadopi, son but affiché, la lutte contre la délinquance, ne pourrait pas demain faire place à une forme d’utilisation tout à fait différente. Que pourrat-on faire demain avec toutes ces caméras que l’on installe aujourd’hui ? Bien des choses.

L’un des point limitants de la vidéosurveillance aujourd’hui est le facteur humain : ceux qui sont installés derrière les moniteurs de contrôle, et qui ont dans les mains un dispositif technologique pour l’instant assez frustre. Une caméra peut repérer des mouvements, voir même identifier des mouvements “suspects” et attirer l’attention de l’humain qui est derrière, mais pour l’instant, rien de plus. Ou pas.

Une jeune startup de la Silicon Valley, Vitamin D, travaille actuellement sur une technologie destinée à donner le sens de la vue aux machines. Leur dernier produit, lancé à la dernière conférence DEMO, est destinée à servir de base au marché prometteur de la recherche vidéo, mais il pourrait servir à bien d’autres choses.

Le logiciel est destiné à reconnaitre et comprendre les actions qui se déroulent dans une vidéo, et à prendre les initiatives adéquates, plutôt que de se reposer sur des métadonnées ou des tags, seuls à même, avec un éventuel texte d’accompagnement, à permettre de chercher et classer des vidéos pour l’instant.

Dans sa forme actuelle, Vitamin D Video est destiné à l’analyse de vidéo et à la surveillance, mais la technologie sous jacente, Hierarchical Temporal Memory (HTM), est conçue sur le modèle du neocortex humain, dans la droite ligne de ce que promet l’intelligence artificielle depuis des lustres. Ses promesses sont nombreuses, et parfois effrayantes, une fois replacées dans le contexte actuel, tant ceux qui légifèrent et décident aujourd’hui de l’utilisation de la vidéosurveillance ignorent totalement ce qui se prépare demain.

Retour aux sources

Les fondateurs de Vitamin D, la crème des ingénieurs qui étaient derrière le Palm et le Treo, affirment que leur application peut distinguer entre des individus et des objets dans un flux vidéo live ou une vidéo archivée d’une façon qu’aucun programme n’avait réussi à faire jusqu’ici.

Cette technologie compile d’énormes quantités de vidéos et en fait des listes d’évènements à un rythme étonnant, ne demande pas la moindre configuration, et son installation ainsi que son paramétrage sont d’une simplicité déconcertante. Un wizard permet très simplement, par exemple, de paramétrer des alertes pour signaler des évènements spécifiques.

Vitamin D pourrait éliminer le besoin pour les humains d’ajouter à leurs vidéos du texte, des tags et des métadonnées : “Vitamin D imagine dans un futur proche un monde où les vidéo peuvent être indexés, recherchés, surveillées, comprises, et donner lieu à des actions automatisée” prédit Allen Bush dans un email envoyé à ReadWriteWeb. “Si les ordinateurs pouvaient comprendre le contenu d’une vidéo sans qu’un humain ai à le leur décrire, beaucoup d’applications disruptives apparaitraient”.

La création d’un moteur de recherche vidéo serait bien évidemment quelque chose de particulièrement enthousiasmant, son application aux dizaines de milliers de caméras de surveillance qui colonisent les villes du monde entier, à l’inverse, est un grand pas en avant vers 1984.

En 2005, Jeff Hawkins, fondateur de Palm et chercheur en neuroscience, a fondé une société appelée Numenta. HTM, la technologie développée par Numenta, se concentre sur une nouvelle génération d’intelligence artificielle. Elle permet aux machines de reconaitre, d’apprendre et de comprendre des modèles récurrents (patterns) au sein d’énormes quantités de données. La plateforme HTM, qui sert de base à la technologie de Vitamin D, peut s’appliquer à une multitude de problématiques différente, de la vision par la machine à la détection de la fraude en passant par l’analyse sémantique de texte.

HTM est basé sur la théorie du néocortex décrite pour la première fois dans le livre de Hawkins “On Intelligence”, et a été traduite sous une forme mathématique par Dileep George, cofondateur de Numenta.

D’autres applications de HTM pourrait permettre de résoudre des problèmes comme la reconnaissance d’objets dans une image, la prévision du trafic routier ou des mouvement de foules, la reconnaissance de caractères dans une images brouillée, le diagnostic d’imagerie médicale ou la prédiction du taux de clic sur une page web.

L’une des démonstration montre l’analyse en temps réel d’une vidéo où la technologie détecte les humains présents dans une vidéo, au sein d’un environnement particulièrement chargé, où différents éléments sont en mouvement avec, qui plus est, des conditions d’éclairage particulièrement médiocres.

Vous pouvez télécharger une démonstration du logiciel destiné à détecter les êtres humains dans un flux vidéo temps réel (Mac et PC), afin de mettre en place chez vous votre propre Big Brother personnel. Imaginez ce que cela donnera sous peu, une fois connecté aux caméras vidéos qui surveillent nos villes, et demandez vous si les décisions que nous prenons à la va vite aujourd’hui n’affecterons pas de façon dramatique le monde de demain.

(image d’illustration : Brazil de Terry Gilliam, © 20th Century Fox)


Recommandez cet article à vos amis

et rejoignez nous sur Facebook et Twitter...



8 commentaires pour cet article

  1. Louis

    Humm, c’est très intéressant. Et y’a du boulot derrière.

    Ca sent la boite qui va vite se faire racheter par Google :-D

  2. clarinette02

    L’etat en charge des cameras de surveillance ne fera jamais rien de mal, soyons confiants.
    Vous revez de donner VitamineD a Google StreetView? La nouvelle generation de Google Street View cameras « immersive 360 video’ (spherical video) est capable d’enregistrer des images videos et non plus simplement des shots fixes, interactives et navigables a distance pour visionner sous angles mutiples.
    Cessons d’etre paranoia, ‘omniveillance’ n’est qu’un mythe qui occupe quelques academiques en mal de ‘Human Rights’ (Voir Josh Blackman du George Mason University School of Law ‘Omniveillance, Google, Privacy in Public and the Right to Your Digital Identity: A Tort for Recording and Disseminating and Individual’s Image Over the Internet’).
    Les cameras de surveillance et des procedes comme celui de EarthCam avec INTERNET video surveillance 24/24 existent deja. StreetView n’en est qu’une extension a plus grande echelle.
    Grace aux programmes de reconnaissance faciale (facial software recognition) et l’aide de companies comme Everyscape (qui cherche a etendre la video-surveillance dans des zones rurales) et Earthmine (qui developpe des technologies permettant d’enregistrer les magasins, restaurants et autres lieux publics) nous serons bientot en pleine ‘securite’. Ces nouvelles technlogies vont permettre une diffusion electronique la plus large jamais vu. Nous allons droit vers ce que Berners-Lee, l’inventeur du Web, avait predit comme etant l’avenir du net: le ‘web semantic’ ou les donnees individuelles seront exposees sous toutes les coutures en ligne.
    Avec les procedes de ‘tagging’ et les procedes de ‘reconnaissance faciale’ comme Google Picasa, les sujets peuvent etre automatiquement indexes et tages sur l’image. Le procede Polar Rose est capable de scanner le web regroupant ainsi toutes les photos disponibles et identifiees sur le web. Toujours selon Berners-Lee le tagging serait une des clefs du ‘web semantic’ vers lequel nous nous dirigeons.
    Grace au moteur de recherche Google, il devient aise de retrouver l’identite de la personne photographiee, d’y associer ses donnees personnelles, ses preferences, amis et autres donnees disponibles et eparses dans le web. Google s’est dit developer un programme de ‘visual crawling’ pour les analyses faciales et analyses sceniques.

    Quelle avancee!!
    Oui mais tout ceci se passe de l’autre cote de l’Atlantique?

    Detrompez-vous, la France n’a rien a envier aux americains. C’est une companie francaise, Quividi, qui a installe a New York des panneaux publicitaires equipes de cameras et d’ordinateurs puissants capables d’analyser les visages de passants devant les cameras pour leur servir une publicite sur-mesure adaptee a leur age et sexe detreminee par le logiciel. Le procede qui devait etre utilise a la station Charles de Gaulle Etoile a Paris.
    Dan Solove, un autre academique americain qui a beaucoup travaille sur le sujet, met l’accent sur le danger de rendre public les moments intimes d’autant que sorti hors contexte, les sujets n’ont pas la possibilite de rectifier leur image sur internet. Ces enregistrements, diffusions et archivages des donnees enlevent aux individus le droit de rehabilitation. Comme un elephant, l’internet n’oublie jamais dit Blackman (voir egalement Bernhard Warner: ‘How To Be UnGoogleable’ Times Online 28 Mai 2008). Ce que d’autres ont appele la theorie de la conservation de la matiere, ce qui est diffuse sur internet, meme repris, ne s’efface jamais et ne laisse aucune chance au repenti. C’est diffuse a grand echelle, a grande vitesse et souvent sans seconde lecture et ne laisse aucune seconde chance. La ‘dog poop girl’ et le ‘star wars boy’ n’en sont que les victimes les plus celebres.

    Mais, pas de paranoia, ne craignons rien, tout va bien Madame la Marquise, dans le meilleur des mondes surveilles a la moelle!!

  3. Fix

    Ouaip, ouaip.

    Le mot important dans l’article est « logiciel ». Les avancées algorithmiques multiplieront le potentiel des logiciels par … 1000 ? 1000 milliards ?

    Le mot important qui n’est pas dans l’article est « usage ». Avec les logiciels, quels usages inventeront … les particuliers, les entreprises, les collectivités, l’Etat ?

    Je parie que des usages en réseau innovants (nocifs ? utiles ?) vont surgir.

    Illustration ici : http://bit.ly/2yVhnY :-)

  4. y!onel

    Il y a au moins aussi en France une société qui fait la même chose (basée à Sophia Antipolis et une spin off de l’inria) :
    http://keeneo.com/
    Je ne connais pas assez bien le domaine pour voir la différence entre ce qui est décrit dans l’article et ce que fait cette société mais à première vue c’est la même chose.
    Ils ont eu la visite de C. Estrosi il y a qques temps qui compte peut être expérimenter cela à Nice…..

  5. clarinette02

    Sur les ecrans numeriques, voir :
    Écrans du métro : la RATP et Métrobus assignés au TGI
    http://www.bap.propagande.org/modules.php?name=Forums&file=viewtopic&t=3479
    http://blogs.lentreprise.com/la-marque-dans-tous-ses-etats/2009/03/les-ecrans-publicitaires-de-la.php
    Le Refere: ‘France : Affaire Metrobus/RATP/Majority Report – la juge des référés déboute les associations, pas de jugement sur le fond’
    http://fr.ooh-tv.com/2009/04/30/france-affaire-metrobusratpmajority-report-la-juge-des-rfrs-dboute-les-associations/

  6. Layer973

    « Mac et PC » Je n’en reviens toujours pas de trouver encore et encore cette erreur. Matériellement les MAC sont aujourd’hui des PC. Avoir un PC ne signifie pas avoir Windows. Et oui je suis un Linuxien.

  7. Fabrice Epelboin

    Hé ben si c’est tout ce que cet article t’inspire, c’est triste pour un Linuxien.

  8. Video Surveillance

    Article intéressant… Le monde avance, les technologies aussi, tout dépendra de l’utilisation que concrètement le monde en fera !

1 Trackbacks For This Post

  1. Tweets that mention La vidéo surveillance de demain s’invente aujourd’hui | ReadWriteWeb France -- Topsy.com :

    [...] This post was mentioned on Twitter by Fabrice Epelboin. Fabrice Epelboin said: La vidéo surveillance de demain s’invente aujourd’hui http://bit.ly/2vCEDS [...]

  • A propos
  • Best of
  • Buzzing
  • Tags

ReadWriteWeb est un blog dédié aux technologies internet qui en couvre l’actualité et se distingue par ses notes d’analyse et de prospective ainsi que par l’accent mis sur les usages et leurs impacts sur les média, la communication et la société. Il est classé parmi les blogs les plus influents de la planète par Technorati et Wikio. Publié en cinq langues, il s'appuie sur un réseau de correspondants locaux en Nouvelle-Zélande, aux Etats-Unis, en France, en Espagne, au Brésil, en Chine ainsi qu'en Afrique francophone. Ses articles sont publiés dans la rubrique technologie du New York Times.


Partenaires

hébergement infogérance Bearstech
ATLN Association Tunisienne pour les Libertés Numériques

af83



Tunisie média

Appli iPhone


 

Recommandés



Activité sur le site