Powered By Blogger

Rechercher sur ce blogue

Aucun message portant le libellé OpenAI. Afficher tous les messages
Aucun message portant le libellé OpenAI. Afficher tous les messages

vendredi 5 avril 2024

Voice Engine : un nouvel outil IA pour cloner des voix, aussi puissant qu'inquiétant

 Voice Engine : un nouvel outil IA pour cloner des voix, aussi puissant qu'inquiétant


Par: Tanguy Jaillant

03/04/24 17:28

Après le texte, des images les vidéos, OpenAI s'attaque au son, avec Voice Engine, un nouvel outil IA capable de cloner des voix humaines avec un réalisme saisissant. Encore une technologie bouffante, mais qui pourrait être mal employée.


Une fois de plus, l'intelligence artificielle a permis de mettre au point un outil aussi spectaculaire qu'effrayant. Le vendredi 26 avril dernier, la start-up californienne OpenAI, connue pour avoir développé ChatGPT, un agent conversationnel, et Sora, une IA capable de générer des vidéos d'un réalisme époustouflant, a dévoilé un tout nouvel outil capable de cloner des voix. Baptisée Voice Engine, cette technologie boostée par l'intelligence artificielle peut en effet reproduire la voix d'une personne après l'avoir écoutée pendant seulement quinze secondes. Ce système n'est donc pas entièrement nouveau, puisque OpenAI avait déjà développé une première version à la fin de l'année 2022, qu'elle avait intégrée aux fonctions de synthèse vocale dans ChatGPT. Cependant, il s'agit bien de la toute première fois que la start-up communique publiquement sur cette nouvelle offre de service.



Voice Engine : des imitations parfaites… et dangereuses !

En tout cas, les résultats publiés par la société sont bluffants. En effet, Voice Engine est capable de reproduire des accents, des intonations, des nuances et, plus généralement, toutes les caractéristiques spécifiques de la voix d'une personne. Ainsi, il est de plus en plus difficile de faire la différence entre une voix clonée et une voix réelle. Grâce à cette technologie, OpenAI compte bien offrir de nouvelles possibilités à ses utilisateurs. Par exemple, l'outil peut être utilisé comme une aide à la lecture pour les personnes qui ont perdu la voix, un traducteur de contenu (puisqu'il fonctionne en français et dans d'autres langues), ou encore un assistant à la lecture pour les enfants ou les personnes qui ne savent pas lire. Mais ce n'est pas tout ! L'intelligence artificielle peut aussi être amenée à s'implanter dans le quotidien des fans de littérature. En effet, Voice Engine pourrait être utilisé dans la conception de podcasts audio, de livres audio, et même à la radio.



Malheureusement, la technologie a déjà été utilisée à des fins criminelles. Alors que les États-Unis sont en pleine période de campagne électorale, des cybercriminels ont usurpé la voix de Joe Biden pour appeler des électeurs. Face à un tel danger, l'entreprise a adopté une position délibérément prudente et pris plusieurs mesures de sécurité. Tout d'abord, Voice Engine n'est pas accessible au grand public, mais uniquement à des partenaires qui ont accepté les conditions d'utilisation d'OpenAI, leur interdisant de pratiquer l'usurpation d'identité ou d'exploiter une voix sans le consentement de la personne.


Les partenaires sont également obligés d'indiquer que la voix utilisée a été générée par l'intelligence artificielle. "Nous travaillons avec des partenaires américains et internationaux issus du gouvernement, des médias, du divertissement, de l'éducation, de la société civile et d'autres secteurs, et nous prenons en compte leurs commentaires au fur et à mesure que nous développons l'outil", a indiqué la société, avant de conclure : "Nous avons mis en place un ensemble de mesures de sécurité, y compris une marque en filigrane pour pouvoir retracer l'origine de tout son généré par Voice Engine, ainsi qu'un contrôle proactif de son utilisation."


REF.: https://www.commentcamarche.net/informatique/intelligence-artificielle/30725-openai-voice-engine/#utm_source=facebook&utm_medium=social

samedi 17 février 2024

Sora : découvrez les incroyables vidéos créées par la nouvelle IA d'OpenAI

Sora : découvrez les incroyables vidéos créées par la nouvelle IA d'OpenAI


Par: Maurine Briantais

16/02/24




OpenAI présente Sora, sa nouvelle IA capable de générer des vidéos d'un réalisme époustouflant à partir d'une simple description textuelle. Les résultats sont tellement impressionnants qu'ils soulèvent déjà des questions éthiques.Rien ne semble pouvoir arrêter OpenAI, qui multiplie les projets d'intelligence artificielle générative avec des outils tous plus bluffants les uns que les autres ! Alors que l'entreprise derrière ChatGPT a annoncé développer son propre moteur de recherche pour concurrencer Google – rien que ça ! –, l'entreprise américaine vient de dévoiler un tout nouvel outil. Baptisé Sora, qui signifie "ciel" en japonais, en référence à l'infinité de possibilités offertes – rien à voir avec le héros de Kingdom Hearts –, il permet de générer des vidéos à partir d'une simple demande textuelle. Sam Altman avait déjà annoncé son projet en janvier 2023, sans toutefois donner beaucoup de détails. Concrètement, il fonctionne comme n'importe quel éditeur d'images dopé à l'IA – comme DALL-E – : il suffit d'écrire sa demande pour que l'intelligence artificielle s'exécute, mais au lieu de créer une image, il génère une vidéo, dont la durée peut aller jusqu'à 60 secondes. Et le moins que l'on puisse dire, c'est que le résultat est bluffant de réalisme ! Voilà qui risque d'inquiéter les artistes, qui mettent généralement plusieurs heures à produire ce genre de contenu...l’arrivée de Sora, une intelligence artificielle “texte vers vidéo”.

Sora : des vidéos d'un réalisme époustouflant

"Sora est capable de générer des scènes complexes avec plusieurs personnages, des types de mouvements spécifiques et des détails précis sur le sujet et l'arrière-plan. Le modèle comprend non seulement ce que l'utilisateur a demandé dans l'invite, mais aussi comment ces choses existent dans le monde physique", explique OpenAI. Ces courtes vidéos produisent des scènes diverses et variées, comme un couple marchant dans les rues enneigées de Tokyo, des mammouths courant dans la neige, un monstre en admiration devant une bougie, ou encore la visite d'une galerie d'art avec de nombreuses œuvres d'art de styles différents. Voici un exemple de prompt : "La belle ville de Tokyo enneigée est agitée. La caméra se déplace au sein des rues animées, suivant plusieurs personnages en train d'apprécier la météo hivernale et de faire du shopping. Des pétales de sakura [ndla : fleurs de cerisiers] volent dans les airs, en compagnie de flocons de neige." On vous laisse juger du résultat !

Les vidéos sont extrêmement réalistes et comportent de multiples détails, avec une caméra qui s'amuse à virevolter dans le ciel. Il y a même un petit monstre que l'on croirait tout droit sorti d'un film d'animation de Pixar ou de Dreamworks ! Heureusement qu'il y a un marqueur, sinon il serait difficile de les différencier de vidéos authentiques. Mais comment est-ce possible ? "Sora s'appuie sur des recherches antérieures sur les modèles DALL-E et GPT. Il utilise la technique de récapitulation de DALL-E 3, qui consiste à générer des légendes hautement descriptives pour les données d'entraînement visuel. En conséquence, le modèle est capable de suivre plus fidèlement les instructions textuelles de l'utilisateur dans la vidéo générée", explique Open AI dans un communiqué.

L'IA utilise un important ensemble de données issues de vidéos, qui sont ensuite analysées par le système, qui va générer des millions de mots descriptifs des images. Lorsque l'utilisateur émet sa requête par écrit, Sora l'analyse et en extrait les mots-clés qu'elle juge pertinents. Elle recherche ensuite les vidéos qui correspondent le mieux aux mots-clés, puis les extrait de sa base de données et les assemble pour créer le clip vidéo. Mieux encore, l'outil est capable d'étirer une vidéo déjà existante en l'étendant "vers l'avant et vers l'arrière, afin de produire une boucle infinie transparente". Elle fait bien évidemment en sorte que les personnages se déplacent de manière cohérente dans l'espace tridimensionnel.

Vous pouvez découvrir de nombreux exemples de vidéos réalisées avec Sora sur la page de présentation d'OpenAI. Petite astuce : en cliquant simplement sur un des panneaux latéraux à droite d'une vidéo, vous en verrez d'autres qui ne sont pas affichées par défaut. Et certaines valent vraiment le détour, tant elles sont spectaculaires.

Sora : une IA à ne pas mettre entre toutes les mains

Reste que, si on prête attention, certains détails ne laissent pas de doute quant à l'origine de la vidéo. Par exemple, les jambes de la femme qui déambule la nuit dans les rues de Tokyo s'intervertissent à la 15e seconde de la vidéo. Quant au couple, on peut remarquer un freeze qui fait tache. OpenAI en est bien conscient. "Le modèle actuel a des faiblesses. Il peut rencontrer des difficultés en voulant simuler avec précision la physique d'une scène complexe, et peut ne pas comprendre des cas spécifiques de causalité. Par exemple, un personnage peut manger un morceau de cookie et, l'instant d'après, le cookie reste intact", concède l'entreprise. 

Mais on peut légitimement s'interroger sur les dangers qui peuvent découler d'un outil si puissant. Comment différencier le faux du réel ? Même si OpenAI prend soin d'incorporer des marqueurs afin d'identifier les vidéos générées par Sora, la plupart des internautes risquent de passer à côté et de prendre pour argent comptant ce qu'ils voient. Et c'est sans compter les contenus problématiques... Aussi, pour le moment, l'IA n'est pas destinée au grand public. L'entreprise annonce prendre "plusieurs mesures de sécurité importantes avant de rendre Sora disponible dans les produits d'OpenAI". Une équipe d'experts "dans les domaines de la désinformation et des contenus haineux" s'occupe de tester l'outil pour le pousser dans ses derniers retranchements afin de mettre en place les garde-fous les plus résistants possibles. Par la suite, l'entreprise de Sam Altman compte déployer l'accès à Sora auprès de quelques artistes, designers et cinéastes afin d'obtenir des retours. Bref, nous ne sommes pas près de l'avoir entre les mains !

mardi 21 novembre 2023

Situation chez OpenAI : Une tempête qui bouleverse le monde de l'IA

 

Situation chez OpenAI : Une tempête qui bouleverse le monde de l'IA
L’avenir d’OpenAI, l’un des leaders mondiaux de l’intelligence artificielle, est actuellement en suspens. Deux scénarios semblent se dessiner : soit l’ancien PDG d’OpenAI, Sam Altman, rejoint Microsoft pour diriger une nouvelle unité de recherche en IA, soit il revient à la tête d’OpenAI en tant qu’entreprise indépendante.

La récente tourmente chez OpenAI, avec la destitution de son PDG Sam Altman vendredi dernier, a provoqué des remous dans l'industrie de l'intelligence artificielle. La situation actuelle chez OpenAI semble se diriger vers deux issues probables, deux scénarios : soit l’ancien PDG d’OpenAI, Sam Altman, rejoint Microsoft pour de bon et dirige une nouvelle unité de recherche en IA, soit il revient à la tête d’OpenAI en tant qu’entreprise indépendante.

Plan A : Altman chez Microsoft
Le PDG de Microsoft, Satya Nadella, a annoncé l'intégration d'Altman à Microsoft pour diriger une nouvelle unité de recherche en IA. Cette décision reste le plan principal. Cependant, l'inconfort de Microsoft vis-à-vis de la structure actuelle du conseil d'administration d'OpenAI est palpable. Nadella insiste sur la nécessité de changements de gouvernance, soulignant que les surprises sont mauvaises pour les affaires.
Plan B : Une OpenAI Indépendante
Il existe un plan B, envisagé comme acceptable par Microsoft, qui verrait le conseil d'administration d'OpenAI démissionner, permettant à OpenAI de continuer comme entreprise indépendante sous la direction d'Altman. Cette possibilité s'inscrit dans un contexte où environ 745 des 770 employés d'OpenAI ont signé une lettre ouverte, menaçant de quitter l'entreprise pour rejoindre Microsoft si le conseil ne démissionnait pas « immédiatement ».
Impact dans l’industrie de l’IA
Cette instabilité a suscité l'intérêt d'autres géants technologiques. Des entreprises comme Google et Salesforce ont déjà fait des offres aux talents d'OpenAI, bien que les employés semblent majoritairement soutenir Altman et Greg Brockman, l'ancien président du conseil d'administration, qui a démissionné vendredi.
Pour les développeurs ayant intégré la technologie d'OpenAI, comme ChatGPT, dans leurs produits, l'avenir reste incertain. Que ce soit sous l'égide de Microsoft ou avec une OpenAI indépendante, le paysage technologique ne devrait pas connaître de changements radicaux, Microsoft ayant l'intention de continuer à développer cette technologie, sous sa forme actuelle ChatGPT ou sous sa marque maison, Copilot.
Le fond de l'affaire : La confiance brisée
La raison du limogeage de Sam Altman semble être liée à des questions de confiance plutôt qu'à des problèmes techniques ou de développement. Le conseil d'administration n'avait apparemment plus confiance en la franchise d'Altman, ce qui a provoqué une crise interne et une réaction négative généralisée de la part des investisseurs et des acteurs de l'industrie. Et en marge de cette crise de confiance du CA, il y a ce nouveau projet d’Altman de créer un concurrent au monopole de NVIDIA pour la création de carte graphique, le nouvel eldorado de l’IA.  
Bref, alors que l'industrie de l'IA continue de se développer à un rythme effréné, la question de la confiance et de la communication transparente entre les dirigeants et leurs conseils d'administration reste cruciale. L'issue de cette crise définira non seulement l'avenir d'OpenAI, mais aussi, potentiellement, le paysage de l'intelligence artificielle dans son ensemble.

RÉF.: Par Bruno Guglielminetti
https://moncarnet.kessel.media/posts/pst_3bc4dc3956ed469eb77d6540ba1735d7?ref=712e1c65-2286-4504-be2b-f2648dfba406&utm_source=post_link&utm_medium=email

dimanche 19 février 2023

Microsoft prépare l’intégration de ChatGPT dans Office (Word, PowerPoint, etc.)

 

 

Microsoft prépare l’intégration de ChatGPT dans Office (Word, PowerPoint, etc.)

Il y aura un avant et un après.


Publié le



ChatGPT est sur toutes les lèvres en ce moment. Et c’est normal, le service de génération de texte et de discussion fourni par la firme OpenAI est aussi puissant qu’étonnant et inquiétant. Il a le potentiel de bouleverser tous nos usages bureautiques et multimédias.

C’est d’ailleurs ce qui a poussé Microsoft à investir il y a quelques semaines dans la société la plus en vogue du moment. Et on en a vu la première conséquence il y a quelques jours, avec l’intégration de l’intelligence artificielle conversationnelle dans le moteur de recherche Bing du géant de Redmond.

Sans surprise, ce dernier ne compte pas s’arrêter là. Selon TheVerge, vous pourrez parler au robot intelligent dans les applications Office très prochainement.

Microsoft insiste sur ChatGPT

En effet, la société signant la suite bureautique la plus utilisée au monde travaillerait actuellement à l’intégration de ChatGPT dans les logiciels Word, PowerPoint, mais aussi Outlook. Si tout se déroule comme prévu, le grand public pourrait découvrir ces nouveautés potentiellement très importantes dès le mois prochain.

La grande démocratisation

On imagine les nombreux bénéfices à pouvoir générer du texte par exemple directement dans un document Word. En outre, si à ce jour, l’accès à ChatGPT demande la réalisation d’une procédure d’inscription un peu laborieuse sur le site d’OpenAI, voir la technologie débarquer dans des applications grand public telles que celles de la suite Office va évidemment grandement démocratiser son usage. De quoi inquiéter encore plus les professionnels(les) de l’éducation déjà bien soucieux face à la grande qualité des devoirs rédigés par intelligence artificielle.

Ne manquez pas non plus :


REF.:  i-nfo.fr - App officielle iPhon.fr
Par : Keleops AG