Une nouvelle solution d'intelligence artificielle permet de détecter des visages et d'identifier des individus à partir d'images de basse résolution et sans grande puissance de calcul.
Devant nous, la photo d’un délinquant responsable
d’une série de vols à la tire. L’image, extraite de la vidéosurveillance
du métro de Toulouse, présente une mauvaise définition de seulement 30 x
30 pixels. Pourtant, les services de police ne vont mettre que quelques
secondes à reconstituer tout le parcours de l'individu dans les
transports à partir de différentes caméras. Et aussi peu de temps à
l'identifier dans leur base de données. Grâce au logiciel de la société
BrainChip qui vient de remporter un prix de l’innovation lors du salon
Milipol la semaine dernière à Paris.
Jusqu’à maintenant, la reconnaissance faciale reposait principalement sur une antique technique consistant à mesurer la distance entre des séries de points constitués par les yeux, le nez ou encore la bouche. Ce qui nécessitait non seulement de recourir à des images HD, mais aussi de disposer d’une certaine puissance de calcul. BrainChip est en passe de s’affranchir de ces contraintes.
« Contrairement à un réseau neuronal convolutif qui doit être entraîné préalablement à reconnaître des critères sur des quantités phénoménales de data, nous pouvons exercer notre réseau à partir d’une seule image », nous explique Bob Beachler, Senior Vice Président Marketing et Business de la société.
C’est ce que l’on appelle de l’apprentissage non supervisé, c’est-à-dire que la méthode consiste à distinguer des motifs récurrents et à regrouper les données par similarité. L’avantage est de pouvoir soumettre de façon spontanée n’importe quelle image avec un minimum de 24 X 24 pixels et d’obtenir un résultat quasiment en temps réel.
Le processus est toujours le même : l'utilisateur crée un modèle à partir d'un visage tiré d'une vidéo ou d'une photo. Si l'image est floue, l'opérateur peut extraire de la même manière un tatouage, un dessin sur un t-shirt ou un accessoire distinctif (voir la capture d'écran ci-dessous). La machine la compare ensuite aux images d'une caméra en temps réel ou à des enregistrements. Elle sort alors un panel de 20 à 30 captures se rapprochant le plus du modèle. A charge pour l'homme de vérifier en bout de course la pertinence du résultat. La puissance du logiciel est telle qu'il est capable d'identifier des personnes même si elles portent une capuche, des lunettes ou qu'elles affichent 20 ans de plus que sur l'image de départ .
BrainChip propose en sus depuis octobre dernier, une version hardware : BrainChip Accelerator. Ce sont des circuits intégrés reprogrammables en silicium. Leur intérêt est d'être facilement intégrable à des serveurs ou des caméras et de multiplier par 6 la vitesse et la précision du logiciel. Intel et IBM s'activeraient actuellement pour sortir des solutions similaires et concurrentes.
Jusqu’à maintenant, la reconnaissance faciale reposait principalement sur une antique technique consistant à mesurer la distance entre des séries de points constitués par les yeux, le nez ou encore la bouche. Ce qui nécessitait non seulement de recourir à des images HD, mais aussi de disposer d’une certaine puissance de calcul. BrainChip est en passe de s’affranchir de ces contraintes.
A l'origine, une technologie française
Cette société née en Australie, a ouvert des bureaux en Californie et racheté l'année dernière la start-up d'intelligence artificielle toulousaine Spikenet, une spin-off du CNRS dont elle reste proche. Son logiciel est donc issu à l'origine d'une technologie française.« Contrairement à un réseau neuronal convolutif qui doit être entraîné préalablement à reconnaître des critères sur des quantités phénoménales de data, nous pouvons exercer notre réseau à partir d’une seule image », nous explique Bob Beachler, Senior Vice Président Marketing et Business de la société.
C’est ce que l’on appelle de l’apprentissage non supervisé, c’est-à-dire que la méthode consiste à distinguer des motifs récurrents et à regrouper les données par similarité. L’avantage est de pouvoir soumettre de façon spontanée n’importe quelle image avec un minimum de 24 X 24 pixels et d’obtenir un résultat quasiment en temps réel.
Le processus est toujours le même : l'utilisateur crée un modèle à partir d'un visage tiré d'une vidéo ou d'une photo. Si l'image est floue, l'opérateur peut extraire de la même manière un tatouage, un dessin sur un t-shirt ou un accessoire distinctif (voir la capture d'écran ci-dessous). La machine la compare ensuite aux images d'une caméra en temps réel ou à des enregistrements. Elle sort alors un panel de 20 à 30 captures se rapprochant le plus du modèle. A charge pour l'homme de vérifier en bout de course la pertinence du résultat. La puissance du logiciel est telle qu'il est capable d'identifier des personnes même si elles portent une capuche, des lunettes ou qu'elles affichent 20 ans de plus que sur l'image de départ .
Un réseau neuronal inspiré de l'homme
Une performance possible grâce à la particularité du réseau neuronal de BrainChip. « Nous nous sommes inspirés du fonctionnement du cerveau humain et de ses synapses qui émettent des décharges électriques pour actionner les neurones », ajoute encore Bob Beachler. L’idée a donc été de copier le système visuel de l’homme dont le traitement d’image repose sur la propagation d’une vague d’impulsions à travers plusieurs couches de neurones. On appelle cela un réseau de neurones impulsionnels (spiking neural network). Et c’est la première société à lancer une suite logicielle basée sur cette méthode dans le domaine de la surveillance civile. Le programme est commercialisé depuis le mois de juillet dernier et testé en France par la police nationale de Toulouse, la DGSE ainsi que la préfecture de police de Paris. Le but n'est pas seulement de s'en servir pour retrouver la trace de suspects mais aussi de potentiels témoins ou victimes.BrainChip propose en sus depuis octobre dernier, une version hardware : BrainChip Accelerator. Ce sont des circuits intégrés reprogrammables en silicium. Leur intérêt est d'être facilement intégrable à des serveurs ou des caméras et de multiplier par 6 la vitesse et la précision du logiciel. Intel et IBM s'activeraient actuellement pour sortir des solutions similaires et concurrentes.