Dans un billet de blog cosigné par Sundar Pichai, PDG de Google, et Demis Hassabis, directeur de DeepMind, le géant de la technologique a présenté son dernier et plus redoutable modèle d’IA, Gemini.
Positionné comme un concurrent direct du GPT-4 d’OpenAI, cette IA se targue de capacités sans précédent, marquant un saut significatif dans l’évolution de l’intelligence artificielle.
C’est quoi Gemini
C’est le modèle d’IA le plus grand et le plus puissant de Google à ce jour, doté d’une capacité inégalée à comprendre, exploiter et intégrer divers types d’informations telles que du texte, du code, de l’audio, des images et des vidéos. Cette flexibilité s’étend à diverses plateformes, des centres de données aux appareils mobiles. Le modèle est disponible en trois versions :
1. Gemini Ultra : La plus grande version conçue pour gérer les tâches les plus complexes.
2. Gemini Pro : Une version intermédiaire optimisée pour un large éventail de tâches.
3. Gemini Nano : La plus petite version conçue pour les fonctions de l’appareil.
La compétence de ce modèle à aborder des sujets complexes est particulièrement mise en avant. C’est la preuve de sa capacité à donner un sens à des données écrites et visuelles complexes. L’entreprise américaine présente les prouesses de cette nouveauté dans une démonstration où le modèle analyse un problème mathématique complexe impliquant des instructions, un graphique et une réponse manuscrite, en identifiant les erreurs et en fournissant des explications approfondies.
Gemini vs GPT-4
Dans une comparaison directe avec son principal concurrent, GPT-4 d’OpenAI, l’entreprise dirigée par Sundar Pichai affirme que sa création surpasse GPT-4 dans plusieurs domaines. Google a effectué des tests dans le domaine Massive Multitask Language Understanding (MMLU), couvrant 57 thèmes divers, où l’IA aurait surpassé les experts humains avec un score de 90 %.
Gemini 1.0, y compris la version Pro, est déjà intégré dans Google Bard, ce qui représente une amélioration significative depuis son lancement. La version Nano devrait faire ses débuts dans le Pixel 8 Pro, offrant des fonctionnalités telles qu’une fonction de résumé dans l’app Enregistreur et des réponses automatiques dans le clavier Gboard. Google prévoit d’incorporer l’IA dans Chrome, Search Ads et Duet AI dans les mois à venir.
Les développeurs auront accès à Gemini via les API, et certains clients, développeurs et partenaires du géant de la tech pourront tester la version Ultra.