Visant à faire de Gemini « un assistant IA universel », Google va l’enrichir de nombreuses fonctions, qui ne seront pas accessibles à tous.
Utile à bien des égards, Gemini est amené à devenir bien plus. Lors de sa conférence annuelle dédiée aux développeurs, Google a dévoilé ses projets pour son IA. « Notre vision ultime est de transformer l’application Gemini en un assistant IA universel », a déclaré Demis Hassabis, PDG de DeepMind, la filiale IA de Google.
Autrement dit, « il s’agit d’une IA intelligente, qui comprend le contexte dans lequel vous vous trouvez et qui peut planifier et agir en votre nom, sur n’importe quel appareil », a-t-il précisé. Gemini, qui va s’inviter sur de nombreux appareils devrait ainsi, à terme, rendre les utilisateurs plus productifs, notamment en effectuant les tâches du quotidien pour eux.
Un Gemini plus puissant et plus personnel
Une vision encore lointaine, qui inclut entre autres deux projets au stade de prototype. Le premier est le projet Astra, une IA multimodale qui dispose de capacités de mémoire et le partage d’écran. Des capacités qui ont été intégrées dans l’IA vocale Gemini Live, lui permettant de « voir » à travers la caméra du smartphone et de répondre à des questions sur ce qu’elle « voit ». Des usages qui sont désormais disponibles gratuitement pour l’ensemble des utilisateurs.
Le projet Astra sera aussi intégré au moteur de recherche, permettant aux internautes de discuter de ce qu’ils voient en temps réel avec l’IA.
Le second, est le projet Marimer, lancé en décembre dernier. Il s’agit d’un « prototype de recherche agentique » qui peut aider l’utilisateur à « gérer jusqu’à 10 tâches simultanément – de la recherche aux réservations et aux achats ». Autrement dit, il est composé d’un réseau d’agents, ces IA capables de réaliser des actions à la place de l’utilisateur, qui peuvent chercher des informations, faire des réservations ou encore effectuer des achats en même temps.
Intégré dans l’application Gemini, le projet Marimer sera uniquement disponible aux États-Unis et sera ensuite propagé en Afrique. De plus, il sera nécessaire d’être abonné à la nouvelle formule, Google AI Ultra, lancée ce mardi 20 mai aux États-Unis. Pour 145.158 FCFA par mois, elle permet d’avoir moins de limites en termes d’utilisation, mais aussi d’accéder aux modèles d’IA les plus performants et aux fonctions premium. Elle s’adresse surtout aux professionnels comme les réalisateurs ou les développeurs.
Car Google a dévoilé d’autres fonctions pour rendre Gemini « plus personnel, plus proactif et plus puissant ». Lors de sa conférence, la société a en effet présenté plusieurs outils dédiés à la création. Parmi eux figure Imagen 4, un nouveau modèle de génération d’image qui « associe la vitesse à la précision pour créer de magnifiques images ». Selon l’entreprise, il offre une clarté remarquable dans les détails comme les gouttelettes d’eau ou la fourrure animale.
Veo 3, de son côté, peut générer des vidéos de qualité avec, pour la première fois du son. Que ce soient des bruits de trafic, des oiseaux chantant dans un parc ou même du dialogue, il peut être utilisé pour raconter de courtes histoires à partir d’une simple requête. La vidéo d’introduction de la Google I/O a d’ailleurs été générée avec cet outil IA.
Enfin, Google a dévoilé Flow, un outil de réalisation permettant de créer des clips, des scènes ou des histoires cinématographiques avec Veo, Imagen et Gemini. Chose qu’il sera possible de faire avec un langage naturel.
Toutes ces fonctions seront aussi uniquement disponibles pour les abonnés à Google AI Ultra, tout comme l’utilisation de Gemini dans Chrome, Gmail ou encore Docs. Certaines d’entre elles, seront cependant accessibles avec Google AI Pro, nouveau nom de la formule Google One AI Premium (12.768 FCFA par mois).
Source : BFM