Grâce à l’IA, des chercheurs décodent les aboiements des chiens
Par Antoine Gautherie le 8 juin 2024 à 9h02
Ces travaux encore balbutiants, mais assez fascinants pourraient un jour permettre aux éthologues de mieux comprendre le comportement des animaux.
Même les spécialistes du comportement qui sont particulièrement doués pour interpréter les vocalisations des chiens sont incapables d’en comprendre toutes les nuances – mais cela pourrait changer grâce au machine learning. Une équipe de chercheurs développe en ce moment des outils à base d’intelligence artificielle qui pourraient nous aider à mieux comprendre ce que le meilleur ami de l’Homme essaie de nous dire.
Xiaomi lance un nouveau chien robot
Ce n’est pas la première fois que des chercheurs explorent ce concept. Mais jusqu’à présent, ils se sont tous heurtés au même problème : le manque de données. En effet, tous les modèles de traitement du langage doivent être entraînés à partir d’exemples issus du monde réel. Un algorithme ne peut en aucun cas déterminer la signification d’une suite de sons à partir de rien ; il faut impérativement lui fournir des références.
Or, s’il est très facile de se procurer ce genre de ressources dans le cas des humains, c’est beaucoup plus compliqué pour les animaux. « D’un point de vue logistique, les vocalisations des animaux sont beaucoup plus difficiles à solliciter et à enregistrer », explique Artem Abzaliev, auteur principal de l’étude.
Un modèle conçu pour les humains
Pour surmonter cet obstacle, une équipe de l’Université du Michigan a misé sur une autre approche assez originale : recycler un modèle initialement développé pour la parole humaine. « En utilisant des modèles de traitement du langage initialement entraînés sur la parole humaine, nous avons ouvert une fenêtre sur les nuances des aboiements des chiens », explique sa co-autrice Rada Mihalcea.
Grâce à cette approche, l’équipe a pu commencer à construire son projet sur des bases déjà solides, puisque ces systèmes sont devenus relativement sophistiqués ces dernières années. Il existe déjà des tonnes de modèles capables de distinguer des nuances de timbre, d’intonation ou d’accent. Certains sont même capables de reconnaître les émotions (frustration, gratitude, dégoût…) qui transparaissent dans un enregistrement audio. « Ces modèles sont capables d’apprendre à encoder les motifs incroyablement complexes du langage humain, et nous voulions voir si nous pouvions exploiter ces capacités pour interpréter les aboiements des chiens », explique Abzaliev.
Son équipe est donc partie de Wav2Vec2, un modèle conçu pour les humains, et lui a présenté un jeu de données composé d’enregistrements de 74 chiens. Ils provenaient d’animaux de races, âges et sexes variés, et ont été collectés dans de nombreux contextes différents (jeu, détection d’un élément perturbateur comme un petit animal, réflexe de défense, interactions sociales…). Grâce à ces données, Abzaliev a pu altérer l’importance des connexions qui relient les neurones artificiels du réseau (les poids) ainsi que les biais qui les régissent.
Des résultats encourageants
Au bout du processus, l’équipe a pu générer des représentations des données acoustiques collectées chez les chiens et les interpréter. En analysant les résultats, ils ont constaté que le modèle avait classé les enregistrements dans la bonne catégorie (jeu, anxiété, recherche d’attention, douleur, frustration…) dans 70 % des cas.
Un résultat encore assez approximatif, mais bien supérieur à ce dont sont capables les modèles entraînés exclusivement sur des enregistrements d’animaux. « C’est la première fois que des techniques optimisées pour la parole humaine participent ainsi au décodage de la communication animale », se réjouit Mihalcea.
Une ressource pour les chercheurs ?
Au-delà des résultats bruts, ces résultats ont une implication très intéressante : ils prouvent que les sons et les motifs inhérents au langage humain peuvent servir de fondation pour analyser les vocalisations des chiens, et peut-être même d’autres espèces. Par conséquent, une fois mature, ce système pourrait devenir un outil très intéressant, notamment pour les éthologues.
Chien tablette Apple problème
Ces chercheurs spécialisés dans l’étude du comportement animal se reposent souvent sur les vocalisations pour étudier les interactions au sein des groupes, les particularités comportementales et même les capacités cognitives de leurs espèces de prédilection. Par conséquent, un outil de ce genre pourrait les aider à identifier des nuances qui auraient autrement pu leur échapper… ou tout simplement leur prémâcher le travail. Imaginez par exemple une équipe de spécialistes qui étudie les primates dans un environnement difficile, comme une jungle. Au lieu de passer un temps considérable à éplucher des enregistrements audio pour classifier des vocalisations et les attribuer à un certain type de comportement, ils pourraient confier cette tâche à un modèle IA pour identifier des relations et des tendances intéressantes beaucoup plus rapidement.
Les chercheurs n’abordent pas du tout cette thématique dans leur papier, mais en extrapolant, on peut aussi imaginer qu’un jour, un système d’IA générative pourrait permettre de synthétiser des sons spécifiquement calibrés pour porter un transmettre un message bien précis à un animal. Pour l’instant, cela relève encore de la science-fiction pure. Mais peut-être qu’un jour, l’intelligence artificielle nous permettra enfin de “discuter” avec nos fidèles compagnons, de comprendre le chant des baleines ou d’en apprendre davantage sur les raisons qui poussent les orques à attaquer des bateaux, par exemple.
REF.: https://www.journaldugeek.com/2024/06/08/grace-a-lia-des-chercheurs-decodent-les-aboiements-des-chiens/?fbclid=IwZXh0bgNhZW0CMTEAAR1YT4H1mK2EePwRJWJRCY5pjn_S6vzyiACfWfM9yn22DNkIH_pGUwLinIM_aem_ZmFrZWR1bW15MTZieXRlcw
Aucun commentaire:
Publier un commentaire