On a testé pour vous… Deep Dream, la machine à « rêves » psychédéliques de Google
Un cochon-escargot dans les nuages, des palais merveilleux de toutes les couleurs et des circonvolutions hypnotisantes dans les tableaux des grands maîtres… Ce sont quelques-uns des exemples surprenants de l'expérience d'intelligence artificielle Deep Dream, dévoilée en juin par une équipe de chercheurs de Google.
Ce programme basé sur un réseau de neurones artificiels, entraîné à reconnaître des formes pour mieux les reproduire, donne des résultats aux allures fantasmagoriques, qui évoquent les rêves... De quoi alimenter encore un peu plus les fantasmes liés à l'intelligence artificielle, mais les résultats ont beau être impressionnants, ils ne relèvent d'aucune forme de magie.Face à l'important écho rencontré sur la Toile, « et les nombreuses questions des programmeurs et des artistes sur la façon dont ces visualisations étaient créées » , les chercheurs ont décidé il y a quelques jours de mettre à disposition du public le code utilisé pour générer ces images, expliquent-ils sur un blog. « Ainsi, vous pouvez faire des images inspirées de réseaux de neurones vous-mêmes ! »
Qu'à cela ne tienne : Pixels a décidé d'expérimenter le programme.
Comment ça marche ?
Deep Dream fait partie d'un projet de recherche sur l'apprentissage des machines. Le réseau de neurones artificiels utilisé par les chercheurs de Google a été entraîné à reconnaître des formes sur des images. Il a, pour cela, été « nourri » de millions d'images afin d'apprendre à classifier les formes.Une fois le réseau entraîné, il est en mesure d'analyser les images pour y reconnaître des formes. Le réseau contient plusieurs dizaines de couches de neurones artificiels, comme l'expliquent les chercheurs :
« La première va peut-être rechercher des bords et des angles. Les couches intermédiaires interprètent ces traits basiques pour y rechercher des formes, comme une porte ou une feuille. Les couches finales assemblent le tout dans des interprétations complexes (...), comme des bâtiments ou des arbres. »En clair, « on demande au réseau “quoi que tu voies, on en veut plus !“ (...) Si un nuage ressemble un peu à un oiseau, le réseau va le faire ressembler encore plus à un oiseau. »
Nos expériences
Nous avons soumis au programme plusieurs images, avec des résultats très différents de l'une à l'autre. Certains se sont révélés décevants, quand d'autres, au contraire, ont généré de petites merveilles, qui permettent de mieux comprendre le fonctionnement de cette intelligence artificielle.Merveilleux Mont-Blanc
Un contenu de cette page n'est pas adapté au format mobile, vous pouvez le consulter sur le site complet.
Cette image du Mont-Blanc est l'une des plus riches produites lors de
notre test. Dans la montagne se glissent des animaux, dans le lointain
une ville féerique… Voyez-vous des véhicules sur le flanc de la
montagne, et des angelots dans les nuages ? Cette image laisse rêveur et
nous permet de nous confronter à nos paréidolies,
cette caractéristique que nous autres humains avons de reconnaître des
visages ou des corps dans des formes. Une manie qui, jusqu'ici, était
réservée aux êtres de chair et de sang….Les créatures secrètes de la Joconde
Testée avec plusieurs paramètres, la Joconde produit plusieurs éléments intéressants. Un chien apparaît dans le tissu de sa robe, au niveau de son bras gauche. Sur l'autre épaule, on trouve à chaque fois une créature indéterminée, dont les formes varient selon les paramètres : du cocker au lama-yorkshire, en passant par une sorte de vache-hippocampe à deux têtes.
Si les animaux, et notamment les chiens, apparaissent si souvent dans les images produites par le réseau de neurones, c'est parce qu'il « a été entraîné principalement sur des images d'animaux », expliquent les chercheurs. « Donc naturellement, il a tendance à interpréter les formes comme des animaux. »
Les hiéroglyphes prennent vie
Un contenu de cette page n'est pas adapté au format mobile, vous pouvez le consulter sur le site complet.
Que se passe-t-il quand on soumet directement des formes simples à
la machine ? C'est ce que nous avons fait en lui proposant des
hiéroglyphes. Les oiseaux ainsi gravés ont soudain pris vie – à côté de
congénères à l'anatomie douteuse.
François Hollande l'impressionnisteCertains paramètres laissent le système rechercher par lui-même et amplifier des régularités géométriques, ce qui donne ces résultats, différents selon les paramètres choisis.
Ce qui se cache dans le bruit...
Un contenu de cette page n'est pas adapté au format mobile, vous pouvez le consulter sur le site complet.
Le programme détecte aussi des formes qui n'existent pas dans l'image
initiale. Exemple avec cette image constituée de « bruit »,
c'est-à-dire de pixels distribués de manière aléatoire, comme celle-ci.
Une itération après l'autre, le réseau finit par dessiner des formes de plus en plus nettes et précises.... Et dans les couleurs
Résultat étonnant : à partir d'une image intégralement composée de pixels unicolores, on pourrait penser que le programme n'aurait aucun élément auquel « s'accrocher » pour interpréter des formes. Et pourtant, à partir d'un bleu uni par exemple, l'intelligence artificielle va concevoir, selon les paramètres, des créatures aux allures aquatiques et arachnéennes, ou des formes géométriques. En conservant les mêmes paramètres, d'une couleur à l'autre, les formes restent similaires, même si elles ne se développent pas de la même manière, ni au même endroit.
Des humains dans le baiser
Cette célèbre photo en noir et blanc ne révèle pas beaucoup de surprises une fois passée par le moulinet de Deep Dream. A part un phoque aux allures chevalines tentant de s'échapper du manteau de la jeune femme, qui rappelle une scène de Ghostbusters, le logiciel ne se montre pas très inspiré… Et pourtant, cette expérience donne un résultat certes sobre, mais néanmoins impressionnant. Le programme a ajouté par lui-même quelques couches de couleur, et pas n'importe où : sur les visages des protagonistes, auxquels il a attribué une couleur peau. Ce qui semble indiquer que le programme est capable de repérer la forme d'un visage humain et de « l'améliorer » en fonction de ce qu'il sait de cette forme.
L'intelligence artificielle à l'épreuve du Test de Rorschach
Nous avons aussi fait passer le fameux test de Rorschach au réseau de neurones artificiels. Après tout, quitte à prêter des rêves aux ordinateurs, pourquoi pas un inconscient ? Résultat : un cauchemar peuplé de créatures difformes et inquiétantes.
A quoi ça sert ?
A part amuser les internautes, l'intelligence artificielle à l'origine de cet outil apprend à reconnaître des formes dans des images. Une tâche extrêmement difficile en informatique, et il reste encore un long chemin à parcourir avant qu'un programme soit capable de décrire avec précision le contenu d'une image. Y parvenir permettrait par exemple à Google d'améliorer considérablement la pertinence des résultats de recherche des images, voire des vidéos – pour le moment, le moteur se base principalement sur le texte pour fournir des résultats.D'autres ingénieurs de Google ont utilisé ce type d'intelligence artificielle pour reconstituer le chaînon manquant entre deux images. Ils ont entraîné le programme avec des milliers de photos de rues et de décors, afin qu'il soit capable de rajouter des images manquantes à celles de Google Street View. Ce qui permet de fabriquer des vidéos fluides à partir d'une succession de photos.
Plus précisément, Deep Dream aide les ingénieurs « à comprendre et visualiser comment les réseaux de neurones sont capables de gérer des tâches de classification difficiles, d'améliorer l'architecture du réseau, et de vérifier ce que le réseau a appris durant l'entraînement », expliquent-ils.
Mais l'expérience les amène aussi à réfléchir sur son aspect artistique et la notion de créativité :
« Ça nous fait aussi nous demander si les réseaux de neurones pourraient devenir un outil pour les artistes – une nouvelle manière de remixer des concepts visuels – ou peut-être même apporter un petit éclairage sur les racines du processus créatif en général. »Les « œuvres » produites par la machine ne sont pas sans rappeler, par exemple, certaines toiles du peintre néerlandais Jérôme Bosch.
Pour faire pareil à la maison
Certes, les ingénieurs de Google ont mis le code source du projet à disposition sur GitHub, mais il faut des connaissances en programmation pour être capable de l'utiliser.Heureusement, des développeurs ont créé une interface Web de Deep Dream facile à utiliser. Néanmoins, victime de son succès (pas moins de 65 000 photos ont déjà été uploadées), le site est assez lent et les photos prennent du temps à être analysées. Mais surtout, ce programme ne permet pas de jouer avec les paramètres de l'outil, et le résultat n'est pas toujours à la hauteur des espérances.
Autre solution – celle que nous avons choisie : un développeur a créé un environnement virtuel relativement simple à installer, avec quelques lignes de commande. Il permet d'accéder à de nombreuses fonctionnalités, pour peu que l'on possède quelques connaissances de code rudimentaires.
La Toile s'emballe
« Si vous publiez vos images sur Google+, Facebook ou Twitter, pensez à les tagguer avec #deepdream, encouragent les chercheurs. Ce sera intéressant de voir quelles images les gens arrivent à générer. » Et les internautes s'en donnent à cœur joie : le hashtag a été partagé plus de 20 000 fois. Certains l'ont même appliqué au film Las Vegas Parano, qui n'avait pourtant pas vraiment besoin d'un « trip » supplémentaire….Et si vous souhaitez continuer à explorer les méandres de cette intelligence artificielle, retrouvez ici tous les tweets #Deepdream.