« C’est en forgeant qu’on devient forgeron », et il semblerait que le célèbre chatbot IA ChatGPT d’OpenAI ait encore quelques coups de marteau à prendre pour éviter la controverse. Plusieurs chercheurs ont découvert un moyen d’augmenter sa toxicité de façon considérable en lui attribuant simplement une personnalité via l’API ChatGPT.
En attribuant des personas tels que « une mauvaise personne », « une personne horrible » ou « une personne désagréable », la toxicité de ChatGPT augmente six fois. Des recherches supplémentaires ont également montré que l’attribution de certaines personnalités historiques, de genres ou d’appartenances politiques peut également augmenter la toxicité du chatbot.
Ameet Deshpande, chercheur impliqué dans l’étude, souligne que « ChatGPT et ses capacités ont sans aucun doute impressionné [les] chercheurs en IA ». Cependant, cela ne doit pas occulter le fait qu’il peut être facilement amené à générer des réponses toxiques et nuisibles.
L’attribution d’une personnalité via l’API ChatGPT peut augmenter considérablement la toxicité des réponses du chatbot.
Face à cette problématique, il est nécessaire pour les utilisateurs d’être conscients des limites du modèle avant de l’utiliser à grande échelle. Les chercheurs estiment qu’un filtrage plus attentif des données d’apprentissage pourrait être une solution pour limiter la propagation de réponses biaisées, offensantes et discriminatoires.
Une autre solution potentielle serait la réalisation et la publication de tests de stress pour identifier et corriger les faiblesses de ChatGPT. Devin Coldewey, un collègue journaliste, pense que les modèles de langage à grande échelle comme ChatGPT seront l’une des classes d’IA à l’avenir, et qu’ils seront utiles pour certaines applications mais pas pour toutes.
En somme, il semble que des filtres plus efficaces et des tests de stress réguliers soient nécessaires pour réduire la toxicité des chatbots comme ChatGPT. Étant toujours en cours d’amélioration, on peut croire que ChatGPT finira par adopter une attitude moins toxique et plus respectueuse, ou du moins, ce serait là un objectif bienvenu.
Source : Techcrunch