La compétition pour l’IA a redémarré avec vigueur au printemps 2025. Au cours du mois passé, les acteurs majeurs de l’industrie, OpenAI, Google, Claude, Perplexity et Mistral pour n’en nommer que quelques-uns, ont tous introduit des innovations relatives à leurs outils d’IA. Par ailleurs, de nouveaux modèles ont été dévoilés ou mis à disposition d’un public élargi. Toutefois, en ce qui concerne les performances, qui se distingue réellement ? La Chatbot Arena essaie de déterminer cela en classant les modèles d’IA les plus performants actuellement. Voici les principales tendances du mois de mai 2025.
Comment sont établis les critères du classement ?
La plateforme Chatbot Arena, conçue par la Large Model Systems Organization (LMSYS), a pour objectif d’évaluer les performances des modèles d’intelligence artificielle en se basant sur les évaluations des utilisateurs. Sur la plateforme, on encourage ces personnes à mettre en parallèle deux modèles présentés de façon anonyme et à identifier celui qui, selon leur avis, a le mieux satisfait une demande spécifique. Ce processus de comparaison directe évite les préjugés et garantit une évaluation quelque peu objective.
Ces affrontements déterminent un score Elo pour chaque modèle, une technique de classement largement utilisée dans les échecs et les jeux vidéo compétitifs. Ce classement varie selon les performances : triompher d’un concurrent mieux classé rapporte des points, alors qu’une défaite face à un modèle moins bien classé en entraîne une perte.
Gemini reste la meilleure des modèles d'IA générative
Il est évident que Google s’est distinguée comme l’entreprise la plus active dans le domaine de l’IA en mai 2025. Lors de son événement annuel, le Google I/O, presque toutes les nouveautés liées à l’intelligence artificielle ont été mises en avant : que ce soit pour la vidéo et l’image, la recherche sur internet ou encore Gemini… Et cet investissement semble produire des résultats positifs. Pour le second mois de suite, les modèles Gemini se positionnent en tête dans l’Arène des Chatbots.
Gemini 2.5 Pro et Gemini 2.5 Flash s’emparent des deux premières positions. Ces deux modèles, introduits à la fin mars 2025, visent à rivaliser avec la série « o » d’OpenAI en matière d’intelligences artificielles à chaîne de pensée, capables de segmenter les tâches avant de fournir une réponse.
Le classement des meilleurs modèles d'IA
Parmi les autres membres du top 10, plusieurs figures familières sont présentes, comme Grok et DeepSeek, en plus d’un nouvel entrant : Hunyuan-TurboS. Conçu par Tencent, l’entreprise chinoise qui a donné naissance à WeChat, ce modèle comprend également un processus de raisonnement basé sur la chaîne de pensées.
Selon le Chatbot Arena, voici les 10 modèles d’intelligence artificielle les plus performants en mai 2025, basé sur le score Elo :
- Gemini-2.5 Pro : 1 446
- Gemini-2.5 Flash : 1 418
- OpenAI o3 : 1 409
- ChatGPT 4o : 1 405
- Grok-3 : 1 399
- GPT-4.5 : 1 394
- Gemini-2.5 Flash (version antérieure) : 1 387
- DeepSeek V3 : 1 368
- GPT-4.1 : 1 365
- Hunyuan Turbos : 1 356