ChatGPT va se doter de capacités de “raisonnement” pour répondre à des questions plus complexes afin de se rapprocher du comportement humain.
Des réponses plus rapides, mais surtout plus logiques. Ce jeudi 12 septembre, OpenAI a annoncé le déploiement de son modèle o1, dont l’objectif est de proposer une IA entraînée pour répondre à des questions plus complexes, et ce, le plus rapidement possible.
Pour l’entreprise américaine, o1 aurait comme objectif de répondre aux interrogations des utilisateurs aussi rapidement qu’un humain.
Une IA qui réfléchit vraiment
O1 est loin d’être inconnu des spécialistes. On connaît ce modèle sous un nom de code: Strawberry. Lors des premières rumeurs apparues à la fin de l’été 2024, OpenAI souhaitait alors se rapprocher du raisonnement humain. En clair, ce modèle va intégrer les requêtes précédentes dans son raisonnement à un instant T.
Pour accéder à une version décrite comme “un aperçu”, il faut être abonné à ChatGPT Plus ou ChatGPT Team. Les abonnés Entreprise et Education devraient quant à eux être servis dans quelques jours. Mais OpenAI a précisé vouloir porter le modèle o1 sur la version gratuite de ChatGPT sans donner de date.
En revanche, pour les développeurs souhaitant utiliser l’API liée, la facture s’annonce salée: OpenAI réclame 15 dollars par million de jetons en cas de requête, et 60 dollars par million de jetons en cas de réponse – contre 5 dollars par million de jetons par requête et 15 dollars par million de jetons par réponse avec GPT-4o.
Pour concevoir o1, OpenAI s’est appuyé sur “un nouvel algoritme d’optimisation et d’un nouvel ensemble de données d’entraînement spécialement conçu pour ce modèle,” précise l’entreprise. o1 s’entraîne à résoudre des problèmes par lui-même, via une méthode d’apprentissage par renforcement. Il utilise ensuite une “chaîne de pensée” pour traiter les requêtes, à la manière des humains réfléchissant à résoudre un problème, étape par étape.
Ce modèle pourrait ainsi être utile dans la fabrication de code pour créer des jeux vidéo, comme l’a montré OpenAi sur les réseaux sociaux. Une simple requête peut ainsi lancer o1 sur des pistes de développement, et le modèle continuera à prendre en compte les requêtes précédentes pour ne jamais dévier de sa course et créer quelque chose de jouable.
Pour Jerry Tworek, responsable de la recherche chez OpenAI, les premiers résultats sont satisfaisants: “Nous avons remarqué que ce modèle à moins d’hallucinations”, sans pour autant les supprimer complètement.
Les “hallucinations” sont des éléments qu’imagine l’IA pour répondre à une question en utilisant plusieurs résultats, y comprit ceux qui sont faux, et ce, sans se demander s’il s’agit d’une véritable information. Ce problème a été largement souligné par les utilisateurs de SearchGPT, le moteur de recherche d’OpenAI qui veut concurrencer Google, mais qui est encore en test restreint.
Source: BFM TV