Blogue a Théodule !

mercredi 12 juin 2024

Google: L’arrivée de la fonctionnalité “AI Overview”,Gemini 1.5 Pro, et Astra la caméra intelligente!

Google: L’arrivée de la fonctionnalité “AI Overview”,Gemini 1.5 Pro, et Astra la caméra intelligente!

Google I/O : Alphabet annonce de nombreuses nouveautés

On fait le point sur ces annonces, juste avant la WWDC.

Publié le 15 mai 2024 à 15:14

Par iPhon.fr

Alphabet vient d’organiser sa conférence annuelle, la Google I/O. Lors de cet événement, qui précède de peu la Worldwide Developer Conference d’Apple, son concurrent de Mountain View a notamment annoncé l’arrivée de la fonctionnalité “AI Overview” au sein de son moteur de recherche. Celle-ci, selon nos confrères de chez Presse-citron.net qui se sont penchés sur la question, permet “d’avoir en un clic la réponse à une question complexe, accompagnée d’une revue de presse“.

Lors de l’événement, Google a aussi annoncé que Gemini 1.5 Pro, son alternative à la version premium de ChatGPT, fera son apparition en accès anticipé chez les abonnés Workspace. Il s’agit là du nouveau nom de G Suite, avec à la clé l’outil de traitement de texte Docs, un logiciel de présentation et le tableur Sheets, mais incluant des options avancées indisponibles chez les utilisateurs du grand public.

Du changement pour Android 15

Dans le même temps, Alphabet a annoncé que Gemini 1.5 allait remplacer le Google Assistant sur Android 15. L’éditeur explique ici avoir développé le système en local, ce qui, en théorie, est meilleur pour la cybersécurité des appareils. Il se murmure d’ailleurs qu’une amélioration drastique de Siri dopée à l’intelligence artificielle aura bientôt droit au même atout, peut-être présenté justement lors de la Worldwide Developer Conference.

La version beta pour développeurs d’Android est disponible depuis février dernier. Une version finale est attendue d’ici le troisième trimestre 2024, et devrait donc voir le jour non loin de la date de sortie d’iOS 18, également en version finale. Le nouveau système d’exploitation d’Apple est en effet attendu en beta dès juin aussi, pour un déploiement mondial en septembre.

Astra va chambouler votre smartphone https://www.youtube.com/watch?v=nXVvvRhiGjI&t=63s

Lors de la Google I/O, nous avons également pu découvrir le nouveau projet “Astra” des équipes de Sundar Pichai, qui pourrait à terme être connu sous un autre nom commercial. La vidéo de présentation, à visionner juste ci-dessous, permet de découvrir une caméra intelligente qui reconnaît les objets filmés en direct par l’utilisateur. Une fonctionnalité très pratique, qui n’est pas sans rappeler le succès grandissant de Google Lens ou de la détection de texte avec l’app Appareil photo d’Apple.

Enfin, pêle-mêle, on peut aussi citer les nouveautés suivantes parmi les plus marquantes de la conférence Google I/O cette année :

l’intelligence artificielle permet maintenant d’effectuer une recherche avancée dans Google Photos, par exemple en demandant à l’app de retrouver toutes les images capturées dans des parcs nationaux

la résolution de problèmes avec la caméra, qui peut notamment vous donner des conseils lorsque vous filmez une platine vinyle qui ne fonctionne pas, afin de la réparer

Music AI Sandbox, pour créer des samples automatiquement avec l’intelligence artificielle.

REF.: https://www.iphon.fr/post/google-i-o-alphabet-nouveautes

Bell Media lance 10 nouvelles chaînes télé

Bell Media lance 10 nouvelles chaînes télé

Mon Carnet, le podcast · {ENTREVUE} – Bell Media lance 10 nouvelles chaînes télé

Suzanne Landry de Bell Media présente le lancement de dix nouvelles chaînes « FAST » (Free Ad-supported Streaming TV), disponibles sur les téléviseurs intelligents Samsung et LG. Ces chaînes offrent une programmation thématique gratuite financée par la publicité, visant à élargir l’audience de Bell Media.

La Vice-présidente, Développement de contenu, programmation et information chez Bell Média Télévision, radio et numérique souligne que ces chaînes permettent de découvrir de nouveaux publics et offrent moins de publicité que les chaînes traditionnelles, améliorant l’expérience utilisateur.

Elle évoque aussi l’importance de la découvrabilité des contenus québécois et les efforts du gouvernement pour les rendre plus visibles sur les plateformes numériques.

REF.: https://moncarnet.blog/2024/05/13/bell-media-lance-10-nouvelles-chaines-tele/

Comme prévu, Apple déploie ces 3 fonctionnalités IA à Final Cut Pro, et Logic Pro.

Comme prévu, Apple déploie ces 3 fonctionnalités IA à Final Cut Pro, et Logic Pro.

Elles sont disponibles sur iPad et Mac.

Publié le 15 mai 2024 à 08:52

Par Sami Trabcha

Une semaine s’est écoulée depuis l’annonce des nouveaux iPads par Apple. C’était durant la conférence Let Loose, qui a marqué une nouvelle page pour les tablettes à la pomme. On s’attendait par ailleurs à ce qu’Apple annonce des fonctionnalités qui utilisent l’intelligence artificielle pendant son événement, et effectivement, cela a bien eu lieu.

Cependant, les fonctionnalités annoncées étaient davantage destinées aux professionnels ou passionnés, puisqu’elles sont destinées à Final Cut Pro, et Logic Pro. Le premier est le logiciel de montage vidéo d’Apple, et le second est un outil de production musicale d’Apple.

Aujourd’hui nous parlons de Logic Pro, puisque les fonctionnalités IA annoncées par Apple sont désormais disponibles sur iPad et Mac, suite aux mises à jour qui viennent d’être déployées.

Les fonctionnalités

Logic Pro profite désormais d’une nouvelle fonctionnalité nommée « Session Player », qui comprend « un tout nouveau Bass et Keyboard Player ». Dans sa conférence, la firme à la pomme affirme que les fonctionnalités comprennent des outils « simples » qui « vous permettent de composer la performance parfaite »

. L’application Logic Pro se dote en plus d’un plugin de modélisation nommé Chroma Glow, ainsi que d’une nouvelle fonctionnalité de remixage, appelée Stem Splitter.

Stem Splitter permet de prendre « n’importe quel enregistrement » et d’en extraire « rapidement quatre parties distinctes pour la voix, la basse, les batteries et les autres instruments. » Apple ajoute que : « avec la puissance de M4, tout se passe sur l’appareil, super rapide, donc vous pouvez continuer à remixer votre chanson. »

En savoir plus sur Logic Pro

Logic Pro en est à sa deuxième mise à jour majeur sur iPad, et sa onzième sur Mac. Le logiciel n’était en effet disponible qu’en version bureau à la base, mais Apple a élargi sa disponibilité aux Mac. Un choix qui a enchanté de nombreux compositeurs, qui préfèrent manipuler l’application du bout des doigts. Cela nous ramène logiquement au sujet d’un potentiel MacBook Pro tactile, qui est réclamé par beaucoup de personnes. Un cadre d’Apple s’est récemment exprimé à ce propos dans une interview.

REF.: https://www.iphon.fr/post/ipad-mac-apple-fonctionnalites-ia-logicpro-production-musicale

Comment empêcher Google d'enregistrer votre voix sur votre smartphone

Comment empêcher Google d'enregistrer votre voix sur votre smartphone

Google enregistre discrètement votre voix sur votre smartphone - comment désactiver cette fonction

Maurine Briantais

15/05/24 06:54

Google enregistre automatiquement votre voix lorsque vous utilisez ses services et ses applications. Mais il existe une option cachée dans les paramètres pour désactiver la fonction.

Vous le savez bien, Google est un véritable monstre en ce qui concerne la collecte des données personnelles de ses utilisateurs. Il enregistre toutes leurs activités sur le Web et dans ses applications, ainsi que les interactions verbales avec Search, Assistant et Maps, qu'il utilise "pour développer et améliorer ses technologies de reconnaissance audio". Le problème, c'est que l'entreprise réutilise toutes ces données en les croisant entre elles. Plus intrusif encore, si vous dites "OK Google" ou "Hey Google", votre smartphone va écouter la commande. Avant que vous disiez cette phrase de déclenchement, il écoute donc les mots-clés, même s'il n'enregistre pas tout ce que vous dites.

L'entreprise explique qu'elle enregistre votre activité vocale pour vous aider à obtenir de meilleurs résultats à travers ses produits, en apprenant le son d'une voix, comment vous prononcez les mots et les phrases, et en améliorant la reconnaissance vocale à travers les produits Google. Le souci, c'est que le modèle économique de Google, basé sur la publicité, suscite des soupçons sérieux sur l'utilisation des données à des fins d'analyse marketing et de ciblage commercial des individus. De plus, si des cybercriminels parviennent à accéder à votre compte ou à vos appareils connectés, ils pourraient écouter les enregistrements téléphoniques et voler des informations à partir des données stockées par Google.

Heureusement, il existe une option cachée au sein des paramètres de votre compte Google, que nous vous invitons à désactiver. Pour cela, rendez-vous dans les paramètres de votre compte, via "Gérer votre compte Google", et, dans la barre horizontale, sélectionnez "Données et confidentialité". Faites défiler vers le bas jusqu'à "Configuration de l'historique" et sélectionnez la section "Activité Web et App", où vous verrez qu'il y a une coche bleue. Cliquez dessus. Faites ensuite défiler l'écran vers le bas et vous devriez remarquer qu'une section "Activité vocale et audio" comporte une coche bleue. Décochez-la pour empêcher Google d'écouter.

Faire cela empêchera Google de stocker des enregistrements audio des fonctions vocales de ses services sur votre compte. "Lorsque ce paramètre d'activité vocale et audio est désactivé, les enregistrements des interactions vocales avec Google Search, Assistant et Maps ne sont pas sauvegardés dans votre compte Google sur les serveurs de Google, même si vous êtes connecté", indique l'entreprise de Mountain View. Nous vous conseillons de supprimer également les enregistrements antérieurs que Google a conservés.

REF.: commentcamarche.net

GPT-4o (omni-modal): OpenAI lance son nouvel agent conversationnel

GPT-4o (omni-modal): OpenAI lance son nouvel agent conversationnel

OpenAI vient de dévoiler GPT-4o, son modèle phare qui marque une avancée significative vers des interactions humain-ordinateur plus naturelles. Ce modèle omni-modal, désigné par le “o” de “omni”, accepte en entrée et génère en sortie des combinaisons de texte, audio et image. Cette polyvalence permet à GPT-4o de répondre à des inputs audio en seulement 232 millisecondes, une vitesse comparable à celle d’une conversation humaine.

Parmi les nouvelles fonctionnalités, GPT-4o excelle en compréhension visuelle et audio. Il surpasse ses prédécesseurs en reconnaissance vocale et traduction, tout en offrant des améliorations notables en performance textuelle, notamment pour les langues non-anglophones. Des démonstrations en direct ont montré des scénarios variés tels que l’interview, le jeu « Pierre, Papier, Ciseaux », et la traduction en temps réel.

GPT-4o représente également un bond en avant en termes de sécurité et de fiabilité. Il intègre des systèmes de sécurité avancés pour minimiser les risques liés aux nouvelles capacités audio, incluant des sorties vocales limitées à des voix prédéfinies pour assurer la conformité avec les politiques de sécurité existantes.

Pour les amateurs de technologie et les développeurs, GPT-4o ouvre de nouvelles perspectives passionnantes. La possibilité de combiner texte, audio et image dans un seul modèle simplifie les processus de création et d’interaction, rendant les applications plus intuitives et immersives. Des utilisations potentielles incluent l’amélioration des services de support client avec des réponses vocales naturelles, la création de contenus multimédias dynamiques, et des outils d’apprentissage interactifs en temps réel. OpenAI encourage les utilisateurs à explorer ces nouvelles capacités et à fournir des retours pour continuer à affiner le modèle, promettant des mises à jour régulières pour enrichir encore davantage l’expérience utilisateur.

À partir d’aujourd’hui, les fonctionnalités de texte et d’image de GPT-4o sont disponibles dans ChatGPT, y compris pour les utilisateurs de la version gratuite. Les abonnés Plus bénéficient de limites de messages multipliées par cinq. De plus, les développeurs peuvent accéder à GPT-4o via l’API, qui est deux fois plus rapide et coûte moitié moins que GPT-4 Turbo. Les capacités audio et vidéo seront progressivement introduites pour un groupe restreint de partenaires dans les semaines à venir.

REF.: https://moncarnet.blog/2024/05/13/gpt-4o-openai-lance-son-nouvel-agent-conversationnel/

Rechercher sur ce blogue