Sundar Pichai, PDG de Google et Alphabet, a donné le coup d'envoi de l'édition 20024 de la conférence Google I/O en présentant une série d'innovations rapprochant Google de son objectif : rendre l'IA utile pour tout le monde.
Tous les produits Google, qui comptent plus de deux milliards d'utilisateurs, sont aujourd’hui conçus avec Gemini. A l’occasion de Google I/O, Google a expliqué comment cela l’aide à créer de nouvelles expériences et à rendre ses produits encore plus utiles :
- Extension de l'IA dans la recherche. Grâce à un nouveau modèle Gemini personnalisé - capable de raisonnement en plusieurs étapes, de planification et de multimodalité - combiné à une recherche de premier ordre, les internautes bientôt poser des questions complexes en plusieurs étapes, personnaliser les résultats de recherche et même poser des questions avec des vidéos .
- Présentation de Demander à Photos. Plus de six milliards de photos sont téléchargées chaque jour sur Google Photos. Grâce aux fonctionnalités multimodales de Gemini, Google redéfinit la manière d'effectuer des recherches dans les photos et les vidéos.
- De nouvelles façons d'utiliser Gemini dans l'espace de travail. Les fonctionnalités de Gemini seront étendues à un plus grand nombre d'utilisateurs et intégrées au panneau latéral de Gmail, Docs, Drive, Slides et Sheets. Les fonctionnalités de Gemini seront également ajoutées à l'application mobile Gmail.
- Gemini pour Android. Google intégre l'IA dans le système d'exploitation Android. Les étudiants peuvent désormais obtenir de l'aide pour leurs devoirs en entourant les problèmes avec Entourer pour Chercher. La superposition de Gemini fournira des suggestions dynamiques liées à ce qui se trouve sur votre écran - résumer un PDF ou « demander cette vidéo » - tandis que TalkBack avec Gemini sera capable de fournir des descriptions d'images encore plus détaillées.
- Proposer Gemini 1.5 Pro et Live aux abonnés de Gemini Advanced.
- Gemini 1.5 Pro dans plus de 35 langues, ainsi qu'une fenêtre contextuelle d'un million de tokens - la plus longue de tous les chatbots grand public disponibles dans le monde. Cela signifie qu'il peut comprendre plus d'informations que jamais, comme un PDF de 1 500 pages et bientôt 30 000 lignes de code et une vidéo d'une heure
- Les abonnés à Gemini Advanced auront également bientôt accès à Live, une nouvelle expérience de conversation mobile. Avec Live, ils pourront parler à Gemini et choisir parmi différentes voix naturelles, parler à son propre rythme et même interrompre votre interlocuteur pour lui poser des questions, ce qui rend les conversations plus intuitives.
En plus de ces annonces majeures, d’autres innovations ont été présentées, dont :
- Les prochains modèles d’IA, avec Project Astra, la vision de Google sur la prochaine génération d'assistants d'IA et Gemini 1.5 Flash.
Soutenir au mieux le processus créatif avec Veo, Imagen 3 et Music AI Sandbox.
- L’amélioration de la puissance de calcul grâce à Trillium.
- Développer l’engagement à fournir une IA responsable grâce au développement d’une technique de pointe appelée "red teaming" assistée par l'IA, qui s'appuie sur les avancées de Google DeepMind en matière de jeux, comme AlphaGo, et qui étend les innovations en matière de tatouage numérique, comme SynthID, à deux nouvelles modalités - le texte et la vidéo - afin que le contenu généré par l'IA soit plus facile à identifier.
L’ensemble des billets de blog, des portraits, des intervenants et des visuels est disponible sur l’espace presse dédié à Google I/O 2024.