OpenAI maintient sa domination dans le domaine de l’IA générative en octobre 2024, plaçant ses derniers modèles aux trois premières positions du classement de la Chatbot Arena, réputé pour évaluer de manière objective les performances des modèles grâce aux retours des utilisateurs.
Les modèles GPT-4o, o1-preview et o1-mini conservent leurs places en tête du classement, avec une progression notable de GPT-4o qui surpasse désormais o1-preview en termes de performances. En plus des modèles de la firme de San Francisco, deux modèles chinois, Yi Lightning et GLM-4-Plus, font leur entrée dans le top 10, se classant respectivement 7e et 9e. Cette évolution marque l’absence de grands acteurs tels que Meta, Anthropic et Mistral AI dans les premières positions du classement ce mois-ci.
Le classement des modèles de langage les plus performants en octobre 2024 est le suivant :
1. ChatGPT 4o Latest : 1 339 (Score Elo)
2. o1-preview : 1 335
3. o1-mini : 1313
4. Gemini 1.5 Pro : 1 305
5. Gemini 1.5 Pro 0827 : 1 299
6. Grok-2 0813 : 1 291
7. Yi Lightning : 1 287
8. GPT-4o 0513 : 1 285
9. GLM-4-Plus : 1 274
10. GPT-4o mini 0718 : 1 274
Le classement de la Chatbot Arena, conçu par des étudiants et chercheurs de l’Université de Berkeley, offre une alternative transparente aux méthodes d’évaluation internes des entreprises d’IA. Les modèles sont évalués par des duels arbitré par des humains, et chaque modèle reçoit un score Elo basé sur ses performances lors de ces confrontations.
Avec l’émergence de modèles chinois et la consolidation de la position d’OpenAI, le paysage des modèles d’IA les plus performants évolue en octobre 2024, mettant en lumière la diversité et la compétitivité du secteur.
Source : Chatbot Arena