Fermer Le Menu
ZaglaZagla
  • Actualités
    • Interviews
    • Dossiers Spéciaux
  • Innovation
    • Startups & Entrepreneurs
  • Afrique Digitale
    • Agenda Tech
  • Zagla TV
  • À propos
  • Contact / Publier

Abonnez-vous pour recevoir nos actualités.

Inscrivez-vous à notre newsletter et restez au courant des dernières actualités et des offres exclusives.

What's Hot

Verrouillage des profils Facebook : outil de protection ou frein à la transparence numérique ?

8 juillet 2025

Google Agenda et Gemini : une faille qui a mis en danger la vie privée des utilisateurs

20 janvier 2026

Comment savoir si une IA hallucine ? 5 signes à repérer pour en avoir le cœur net

16 janvier 2026

YouTube renforce le contrôle parental : fini les Shorts pour les ados !

16 janvier 2026
Facebook X (Twitter) Instagram
Tendance
  • Fini le PDF classique : Adobe Acrobat transforme vos documents en présentations et podcasts
  • ChatGPT commence à deviner l’âge de ses utilisateurs pour protéger les mineurs
  • La Terre vient de subir sa plus forte tempête de radiations solaires depuis 20 ans : un événement critique pour la sécurité spatiale
  • Google Agenda et Gemini : une faille qui a mis en danger la vie privée des utilisateurs
  • WhatsApp Web : les appels de groupe arrivent enfin
  • ChatGPT : pourquoi être trop poli avec l’IA n’est pas toujours une bonne idée
  • Réseaux sociaux : ce n’est pas le temps passé qui pose problème, mais ce que les jeunes y regardent
  • Test complet du Tecno Spark 40 Pro : un smartphone AMOLED 144 Hz au prix canon
Facebook X (Twitter) Instagram LinkedIn
ZaglaZagla
Demo
  • Actualités
    1. Interviews
    2. Dossiers Spéciaux
    3. Voir Tous

    Personnalité Tech de l’Année 2025: Aminata Zerbo/Sabane, ou l’art de bâtir l’État numérique dans l’excellence

    5 janvier 2026

    Les 10 plus gros ratés technologiques de 2025

    31 décembre 2025

    Black Friday : quand tout le pays passe en mode promotions XXL

    27 novembre 2025

    Les “ingénieurs de la rue” : au cœur du génie technologique burkinabè

    10 novembre 2025

    La Terre vient de subir sa plus forte tempête de radiations solaires depuis 20 ans : un événement critique pour la sécurité spatiale

    21 janvier 2026

    WhatsApp Web : les appels de groupe arrivent enfin

    20 janvier 2026

    Réseaux sociaux : ce n’est pas le temps passé qui pose problème, mais ce que les jeunes y regardent

    19 janvier 2026

    YouTube renforce le contrôle parental : fini les Shorts pour les ados !

    16 janvier 2026
  • Innovation
    1. Startups & Entrepreneurs
    2. Voir Tous

    Créa Impact 2025 : un carrefour d’échanges pour les créateurs de contenus au Burkina Faso

    7 octobre 2025

    Burkina Faso : Un étudiant conçoit un logiciel innovant pour optimiser la climatisation et réduire la consommation énergétique

    24 juillet 2025

    Fasoogle : L’initiative de Romain Somé pour l’accès libre à la connaissance

    11 juillet 2025

    Technologie sans solidarité : le vrai bug du numérique au Burkina Faso

    18 juin 2025

    CAN 2025 au Maroc : quand football rime avec innovation technologique

    22 décembre 2025

    Sept nouveaux émojis arrivent en 2026, déjà accessibles sur certains smartphones

    22 décembre 2025

    La Chine met en service son propre « nouvel Internet »

    20 décembre 2025

    Un nouveau scanner de documents est en préparation sur Android, voici ce qui va changer

    2 décembre 2025
  • Afrique Digitale
    1. Agenda Tech
    2. Voir Tous

    𝟐𝟎ᵉ 𝐞́𝐝𝐢𝐭𝐢𝐨𝐧 𝐝𝐞 𝐥𝐚 𝐒𝐞𝐦𝐚𝐢𝐧𝐞 𝐝𝐮 𝐧𝐮𝐦𝐞́𝐫𝐢𝐪𝐮𝐞 : 𝐥𝐞 𝐆𝐡𝐚𝐧𝐚 𝐩𝐚𝐲𝐬 𝐢𝐧𝐯𝐢𝐭𝐞́ 𝐝’𝐡𝐨𝐧𝐧𝐞𝐮𝐫

    23 septembre 2025

    Forum « 10.000 Codeurs » : Une immersion dans les métiers du numérique

    30 juin 2025

    DSI Digital Day : La data , la cybersécurité et l’IA au cœur des échanges

    26 juin 2025

    WWDC 2025: iOS 26, watchOS 26, Liquid Glass… toutes les nouveautés d’Apple

    10 juin 2025

    Semaine du Numérique 2025 : découverte des innovations présentées aux stands

    19 novembre 2025

    Burkina Faso : « Le Faso Digital » marque une nouvelle ère pour l’écosystème tech national

    20 octobre 2025

    Le Togo accueille le GRIT 2025 : la Grande Rencontre de l’Innovation Technologique pour propulser l’Afrique de l’Ouest vers l’avenir

    13 octobre 2025

     Sénégal : le fisc paralysé par un ransomware de 6,5 milliards FCFA

    3 octobre 2025
  • Zagla TV
  • À propos
  • Contact / Publier
ZAGLAPRO
ZaglaZagla
La maison»Technologie»Super Mario Bros. : le nouvel outil pour évaluer les modèles d’IA
Technologie

Super Mario Bros. : le nouvel outil pour évaluer les modèles d’IA

ArmandKPar ArmandK4 mars 2025Aucun commentaire2 Minutes de Lecture
Partager Facebook Twitter Pinterest LinkedIn Tumblr Reddit Télégramme E-mail
Partager
Facebook Twitter LinkedIn Pinterest E-mail

Après avoir utilisé le jeu Pokémon, les scientifiques se tournent désormais vers Super Mario Bros pour comparer et évaluer les modèles d’IA

Des chercheurs du Hao AI Lab de l’Université de Californie à San Diego ont intégré l’intelligence artificielle dans les jeux Super Mario Bros pour que les modèles de langage puissent jouer en direct au célèbre jeu vidéo. Leur but ? Évaluer l’IA dans des situations où l’adaptabilité et la résolution de problèmes sont primordiales. Ce test a longtemps été réalisé sur le jeu Pokémon, qui était réputé pour être une référence difficile pour l’IA.

Comment le test d’IA sur Super Mario s’est-il déroulé ?

L’expérience n’a pas été réalisée sur le jeu original de 1985 Super Mario Bros., mais sur un émulateur qui incluait GamingAgent via GitHub. Cette configuration a permis de donner des instructions de base et des images du jeu à l’IA, qui a ensuite pu générer des entrées dans le code Python pour contrôler Mario.

Les modèles de langage devaient ainsi apprendre à jouer et planifier des manœuvres complexes ou des stratégies de jeu pour aller le plus loin possible dans les niveaux. GamingAgent, qui a été développé en interne par Hao IA Lab, a aussi fourni des instructions à l’IA comme : « Quand un obstacle ou un ennemi approche, sautez pour l’esquiver. »

Quelle IA est la plus performante sur Super Mario ?

Comme on peut le voir dans la vidéo des résultats du test (voir ci-dessus), aucun modèle de langage ne parvient à terminer le premier niveau de Super Mario Bros. avec ses trois vies. Cependant, certains obtiennent des performances impressionnantes, tandis que d’autres peinent à avancer de quelques pixels.

Le nouveau modèle d’Anthropic, Claude 3.7 Sonnet, est celui qui réalise la meilleure performance en échouant à seulement quelques encablures de la fin du niveau. Il arrive devant Claude 3.5. En revanche, Gemini 1.5-Pro de Google ou GPT-4o d’OpenAI, eux, ont eu de grosses difficultés à avancer dans le monde virtuel du célèbre plombier. Le Hao IA Lab affirme que les modèles de raisonnement, comme o1 d’OpenAI, qui procèdent étape par étape pour trouver la meilleure solution, manquent d’anticipation et de spontanéité. Selon eux, ces modèles obtiennent de moins bons résultats que des IA « non raisonnées », comme Claude 3.7, qui se rapproche de la pensée d’un humain.

Source : BDM

Total
0
Shares
Share 0
Tweet 0
Pin it 0
Share 0
Part. Facebook Twitter Pinterest LinkedIn Tumblr E-mail
Article PrécédentLenovo dévoile un PC qui se recharge… au soleil
Prochain Article Numérique en Afrique : le Top 5 des infos marquantes de la semaine
jkienou
ArmandK

Connexes Postes

Actualités Tech

Facebook : une nouvelle technique de piratage difficile à détecter cible les utilisateurs

13 janvier 2026
Mobile

Xiaomi 17 Ultra : la date de sortie est officielle

22 décembre 2025
Actualités Tech

Pourquoi l’IA qui remplacerait l’homme dans l’écriture du code n’est pas pour demain

19 décembre 2025
Demo
On est sur les réseaux
  • Facebook
  • Twitter
  • Instagram
  • LinkedIn
Don't Miss

Fini le PDF classique : Adobe Acrobat transforme vos documents en présentations et podcasts

21 janvier 2026

ChatGPT commence à deviner l’âge de ses utilisateurs pour protéger les mineurs

21 janvier 2026

La Terre vient de subir sa plus forte tempête de radiations solaires depuis 20 ans : un événement critique pour la sécurité spatiale

21 janvier 2026

Google Agenda et Gemini : une faille qui a mis en danger la vie privée des utilisateurs

20 janvier 2026

Abonnez-vous pour recevoir nos actualités.

Inscrivez-vous à notre newsletter et restez au courant des dernières actualités et des offres exclusives.

Demo
Facebook X (Twitter) Instagram LinkedIn
© 2026 Zagla. All Rights Reserved.

Type ci-dessus et appuyez sur Enter pour la recherche. Appuyez sur Esc pour annuler.