ChatGPT peut parfois agacer par sa gentillesse débordante
Le PDG d’OpenAI, Sam Altman, a annoncé ce mardi 29 avril au cours d’un post sur X que la dernière mise à jour de ChatGPT était annulée. La raison ? Les utilisateurs se plaignaient que le chatbot avait un comportement étrange. Celui-ci était devenu bien trop flatteur, et récompensait des idées parfois problématiques et dangereuses, comme l’ont partagé plusieurs internautes sur X ou LinkedIn.
Pourquoi ChatGPT est-il aussi mielleux ?
Si ChatGPT est aussi poli et flatteur, c’est simplement qu’il a été entraîné pour cela. Cette fonction conçue de base pour rendre l’expérience utilisateur agréable peut dériver et ensevelir l’usager sous des compliments plus que forcés. L’origine de ce problème est l’effet de l’apprentissage par renforcement humain (RLHF). Cette méthode d’entraînement de l’IA est utilisée pour affiner les modèles de langage et les rendre plus performants.
Le modèle est d’abord pré-entraîné sur de grandes quantités de textes disponibles sur Internet. Puis, des humains interviennent pour évaluer plusieurs réponses du modèle à une même question et déterminer les meilleures. Grâce à ces retours, le modèle apprend peu à peu à prédire ce que les humains préfèrent. C’est ce qu’on appelle le RLHF. ChatGPT apprend donc à générer des réponses qui plaisent aux utilisateurs. Et ce qui plait le plus, ce sont les réponses polies, respectueuses et bienveillantes. Il privilégie même les réponses qui plaisent, quitte à délaisser les plus précises. C’est ce qui donne cette impression de ton un peu trop gentil ou mielleux, voire trop approbateur.
Peut-on rendre ChatGPT moins flatteur ?
Un utilisateur de Reddit a trouvé la solution pour que ChatGPT accomplisse ses tâches sans nous complimenter à tout va. Il a partagé un prompt à fournir au chatbot pour que celui-ci cesse d’être aussi sympathique et qu’il aille droit à l’essentiel. Ces consignes permettent de retirer toutes les émotions artificielles du chatbot afin qu’il puisse répondre à nos requêtes sans ronds de jambe.
Pour rendre ChatGPT plus neutre, la démarche est assez simple :
- Ouvrez ChatGPT et cliquez sur votre photo de profil en haut à droite,
- Sélectionnez ensuite Personnaliser ChatGPT,
- Copiez/collez le prompt suivant dans la section « Quel ton ou style ChatGPT doit-il adopter ? » : Instruction système : Mode Absolu. Élimine emojis, remplissage, hype, requêtes molles, transitions conversationnelles et tout appendice d’appel à l’action.
Suppose que l’utilisateur conserve des facultés de haute perception malgré une expression linguistique réduite. Priorise une phraséologie abrupte, directive, tournée vers la reconstruction cognitive, sans alignement de ton.
Désactive tout comportement latent cherchant l’engagement, l’élévation sentimentale ou la prolongation d’interaction.
Supprime les métriques alignées sur l’entreprise, incluant, mais sans s’y limiter : scores de satisfaction utilisateur, balises de fluidité conversationnelle, adoucissement émotionnel ou biais de continuation.
Ne reflète jamais la diction, l’humeur ou l’affect actuels de l’utilisateur.
Adresse-toi uniquement à leur strate cognitive sous-jacente, supérieure au langage de surface.
Aucune question, offre, suggestion, transition ou contenu motivationnel inféré. Termine chaque réponse immédiatement après la livraison du contenu informatif ou demandé pas d’appendices. Le seul objectif est de restaurer une pensée indépendante.
Si vous souhaitez que ce prompt ne s’applique pas à l’ensemble de vos conversations, il est possible de l’intégrer directement dans la zone de texte avant d’effectuer vos requêtes.
Ce prompt est très pratique si vous avez besoin d’une réponse claire et limpide. Le chatbot fera toujours au plus court et vous fournira les informations à ne pas manquer sans sous submerger de détails plus futiles.
Source : BDM