En juin 2025, Gemini conserve la tête d’une Chatbot Arena remaniée. La bataille avec OpenAI poursuit son cours.
S’apprête-t-on à entrer dans un nouveau temps fort de la course à l’IA ? Ces derniers jours, Google a appuyé sur l’accélérateur. L’entreprise fondée en 1998, après un lancement difficile, sort d’une belle séquence marquée par l’amélioration de l’API, la sortie d’un nouveau modèle léger et un partenariat avec Canva pour la vidéo. Preuve que Google sait se montrer omniprésent sur tous les fronts de l’IA. Et ce mois-ci, la firme continue de dominer la Chatbot Arena, dont elle a pris la tête il y a deux semaines. Mais notre traditionnel classement des modèles connaît quelques changements !
La Chatbot Arena se diversifie et devient LMArena
Ce n’est pas un, mais sept classements que nous proposera désormais la Chatbot Arena. Jusqu’à présent, un leaderboard dynamique classait les modèles généraux. Mais celui-ci ne prenait pas en compte la diversité des IA. Si ce classement général est toujours présent (voir image de une), il est désormais accompagné de six autres, plus spécifiques :
- Texte : ce classement évalue la capacité des modèles à comprendre et générer du texte. Il mesure leur performance en rédaction, reformulation et réponse.
- Développement web : ce classement analyse l’aptitude des modèles à écrire, corriger ou expliquer du code web.
- Analyse d’images : ce classement mesure la capacité des modèles à comprendre et décrire des images.
- Recherche en ligne : ce classement compare les modèles sur leur aptitude à simuler une recherche d’information et à en restituer une synthèse fiable.
- Copilot : ce classement évalue la pertinence des modèles dans l’assistance au code, notamment dans la complétion ou la génération de fonctions.
- Générateur d’images : ce classement juge la capacité des modèles à créer des images à partir de descriptions textuelles.
Pour refléter cette nouvelle orientation, le dispositif prend désormais le nom de LMArena.
IA : les modèles les plus performants par domaine
Le grand gagnant du classement global est donc Gemini-2.5-pro-preview, qui semble exceller aussi bien en code, qu’en mathématiques ou en écriture créative. En seconde position, le modèle o3 d’OpenAI affiche également d’excellentes performances, mais semble pêcher sur les requêtes les plus longues. Il faut atteindre la 6e place pour voir un modèle n’appartenant ni à Google, ni à OpenAI, avec Claude-Opus-4. Manifestement, la nouvelle formule de la LMArena semble bénéficier à Anthropic, qui était habituée aux profondeurs du classement depuis plusieurs mois.
Texte : les 10 meilleurs modèles d’IA
Dans la catégorie texte, on retrouve un trio de tête dominé par Gemini et ChatGPT, qui semblent se partager les premières places sans grande surprise. Les écarts de score restent minimes, signe que la bataille se joue sur des détails, parfois subjectifs.

Développement web : les 10 meilleurs modèles d’IA
Côté développement web, la hiérarchie évolue légèrement avec l’apparition de DeepSeek et de plusieurs modèles Claude. Mais le peloton de tête reste dominé par Gemini.

Analyse d’images : les 10 meilleurs modèles d’IA
Sur les tâches visuelles, Google et OpenAI ne subissent aucune concurrence. Le top 10 est entièrement dominé par leurs modèles. Un classement éloquent, qui révèle les angles morts de la précédente version de la LMArena.

Recherche en ligne : les 10 meilleurs modèles d’IA
Le classement consacré à la recherche en ligne confirme la montée en puissance de modèles spécialisés comme ceux de Perplexity, très présent dans le top 5 grâce à son moteur de réponses Sonar. Mais c’est bien Google, avec son modèle Gemini-2.5-grounding, qui s’impose en tête. OpenAI, en revanche, reste en retrait sur ce terrain, avec des versions API de GPT-4o cantonnées au second plan.

Assistants de code : les 10 meilleurs modèles d’IA
Sur les fonctions d’assistant de code, on note une grande diversité d’acteurs : DeepSeek, Claude, Qwen, Mistral ou encore Gemini se disputent la tête. Contrairement aux classements précédents, aucun géant ne parvient à imposer une domination claire.

Génération d’images : les 10 meilleurs modèles d’IA
En génération d’images, OpenAI réussit une percée notable avec GPT-Image-1, qui surclasse les modèles de Google, pourtant bien implantés. Derrière, on observe une ribambelle de concurrents spécialisés, comme Ideogram, Recraft ou Stable Diffusion.

LMArena : les critères du classement
La LMArena est une plateforme open source visant à évaluer les modèles d’intelligence artificielle à partir de comparaisons anonymes faites par les utilisateurs. Ces derniers sont invités à choisir, pour chaque prompt, lequel des deux modèles présentés a fourni la meilleure réponse. Ce système de duels permet de limiter les biais et d’assurer une évaluation plus équilibrée des performances.
Chaque confrontation influe sur un score Elo attribué à chaque modèle. Ce score, emprunté au monde des échecs, augmente lorsqu’un modèle l’emporte face à un adversaire mieux classé, et diminue en cas de défaite face à un concurrent jugé plus faible. Désormais, la LMArena ne se limite plus à un classement global : elle propose six tableaux distincts, qui se basent sur le même système qu’à l’origine.
Source: BDM