ChatGPT : 5 questions pour tout comprendre au chatbot IA

Véritable phénomène technologique, ChatGPT a franchi la barre des 100 millions d'utilisateurs en un temps record. Mais c'est quoi, au fait, ce fameux robot conversationnel ?

Il n’aura fallu que quelques mois à ChatGPT pour accéder au rang de star de la tech. Avec 123 millions d’utilisateurs mensuels au compteur et une présence médiatique qui n’a rien à envier à Rihanna ou à Cristiano Ronaldo, l’application d’OpenIA semble bien partie pour régner longtemps sur le trône de l’intelligence artificielle.

Cela, même si des concurrents sérieux se sont déjà lancés dans la course, et non des moindres – coucou, Google Bard ! Cet intérêt apparaît pleinement justifié, tant le programme impressionne par sa capacité à générer du contenu bien écrit, structuré et pertinent, sans efforts et avec une verve qui renvoie Siri, Alexa et consorts au rang d’aimables jaseurs. Mais qu’est vraiment ChatGPT ? Comment fonctionne-t-il ? Que peut-il faire – et ne pas faire ? Voici cinq questions essentielles pour tout comprendre au phénomène.

C’est quoi, exactement, ChatGPT ?

Tout le monde parle de ChatGPT, mais tout le monde ne sait pas précisément de quoi il s’agit. ChatGPT est le nom donné à l’interface permettant de dialoguer avec le programme informatique. Lorsque vous utilisez l’application, c’est à l’interface que vous posez vos questions, et c’est elle qui vous répond. Mais ce n’est qu’une façade, un simple chatbot (robot conversationnel) comme ceux qui alimentent les smartphones Apple et Android ou les enceintes intelligentes. Le programme qui se cache derrière est un modèle d’apprentissage du langage de grande taille (un Large Language Model dans le jargon), GTP-3, qui correspond à la troisième version du modèle développé par OpenIA. C’est ce programme qui abrite la fameuse intelligence artificielle dont on parle tant.

Le principal talent de ChatGPT réside dans sa capacité à générer du contenu écrit en réponse aux demandes formulées par les internautes. Il est donc possible d’échanger avec le chatbot de façon presque naturelle, comme on le ferait avec une connaissance. Le texte généré par la machine est si bien structuré et rédigé qu’il n’est pas toujours évident de le distinguer de ce qu’un humain pourrait écrire. En ce sens, ChatGPT est un outil capable d’imiter avec une certaine acuité les tournures et les subtilités du langage. Pour autant, il ne réfléchit pas à proprement parler et ne cherche pas à se faire passer pour un humain – au contraire, il révèle régulièrement son identité de machine dès qu’une question trop humanisée lui est posée. Par exemple, voici ce qu’il répond lorsqu’on lui demande ce qu’il ressent :

Quelles sont les bases du fonctionnement de ChatGPT ?

Qualifier ChatGPT d’intelligence artificielle ne suffit pas à délimiter son fonctionnement, sans parler du fait que l’expression amène plus de questions qu’elle n’apporte de réponses. Pour comprendre les bases de cette machinerie bluffante, il faut d’abord souligner que le chatbot est la conjonction de deux briques technologiques. La première, c’est GPT-3, pour Generative Pre-Training Transformer 3 (ou Pre-trained selon les cas) : un modèle de prédiction de texte que l’on a préalablement entraîné sur la bagatelle de 175 milliards de paramètres. C’est sur cette base encyclopédique qu’il s’appuie pour formuler des réponses cohérentes aux questions qu’on lui pose. Par exemple :

En contrepartie, ce savoir est limité, car le modèle n’est pas actualisé : il faudra attendre GPT-4 pour une mise à jour de ses connaissances (ses références s’arrêtent à la mi-2021).

La seconde brique, c’est un modèle conversationnel appelé InstructGPT fondé sur un système d’apprentissage renforcé. En substance, c’est ce qui permet au programme de consolider sa base de données en tenant compte des retours des utilisateurs sur les contenus qu’il a générés, mais c’est aussi ce qui fait de lui un chatbot raisonnable qui, d’une certaine manière, pèse ses mots. Ce modèle a vocation à modérer ses propos, à éviter d’éventuelles dérives – car, faut-il le rappeler, ChatGPT n’a aucune notion du bien ou du mal – et à jouer le rôle de bon chatbot qui, dans le cadre de la conversation, choisit les réponses les plus correctes compte tenu du contexte.

C’est ce qu’on appelle "l’alignement de l’intelligence artificielle", un champ de recherche qui vise à concevoir des IA avec des objectifs bénéfiques pour l’humanité (voir Wikipédia). Cet alignement est nécessaire puisqu’il évite au robot de répondre lorsqu’on lui demande comment fabriquer une bombe ou assassiner sa belle-mère sans se faire prendre ! Mais c’est aussi ce qui contribue à son amélioration progressive, puisqu’il intègre les correctifs apportés par les internautes pour affiner ses réponses.

À cela, il faut ajouter des modèles conversationnels plus légers, ainsi que des filtres de modération indépendants. Toutes ces briques se combinent pour associer un savoir encyclopédique à une compétence poussée d’imitation du langage – rien de très nouveau, cependant, puisque GPT est lui-même basé sur le modèle d’apprentissage du langage naturel de Google, LaMDA. Là où OpenIA frappe un grand coup, toutefois, c’est en intégrant ce programme à une interface qui le rend accessible à tout un chacun, et permet à un nombre massif d’utilisateurs de converser avec lui.

Comment poser des questions à ChatGPT ?

Pour accéder à l’application d’OpenIA, il suffit de se rendre sur la page dédiée, de s’inscrire avec une adresse email, et une fois celle-ci validée, de taper quelque chose dans le champ qui se trouve en bas sur l’interface. On peut, par exemple, lui demander « C’est quoi ChatGPT ? ».

ChatGPT se présente lui-même, à travers un contenu solide et en apportant des informations parfaitement fiables. Mais il ne se contente pas de livrer une réponse ponctuelle : le programme se souvient des requêtes précédentes, sur lesquelles il peut rebondir pour répondre à une autre demande décontextualisée. Dans l’exemple ci-dessous, la requête « Quel genre de questions ? » est décorrélée de la première demande, mais ChatGPT comprend qu’elle lui fait suite : il répond donc en apportant une précision à sa réponse précédente.

On peut poursuivre sur la même veine, en rebondissant sur le mot « inappropriées » :

Sur ces exemples, vous avez peut-être remarqué la présence de deux icônes, un pouce levé et un pouce baissé (qui rappellent ceux qu’on utilise sur les réseaux sociaux). Ces icônes servent à faire des feedbacks qui, eux-mêmes, vont contribuer à l’amélioration du modèle InstructGPT. Le pouce levé témoigne d’une réponse satisfaisante, le pouce baissé d’une réponse insuffisante ou erronée. Dans les deux cas, la possibilité est laissée à l’utilisateur de motiver son opinion.

Début février, OpenIA a lancé une version premium de son application, appelée ChatGPT Plus, pour une vingtaine de dollars par mois. Elle reste néanmoins accessible gratuitement avec quelques contraintes, comme la moindre rapidité des réponses et le temps d’attente imposé lorsque la plateforme est saturée – ce qui, compte tenu de son succès, arrive régulièrement.

À quoi sert ChatGPT ?

C’est sans doute la question la plus importante : puisque l’application enregistre plus de 100 millions de connexions chaque mois, c’est bien qu’elle sert à quelque chose. Mais à quoi, exactement ? Que peut-on faire avec ChatGPT ?

Il est important de comprendre que le chatbot d’OpenIA n’a pas de fonction précise (au sens où un outil est conçu pour répondre à un besoin spécifique), mais qu’il donne accès à une multitude d’applications pratiques. Il permet notamment de gagner un temps précieux dans la réalisation de certaines tâches. Voici quelques exemples des contenus que ChatGPT est capable de générer.

Écrire un email personnel ou professionnel.

Rédiger un post social (comme un tweet).

Produire le squelette d’un article de blog (ici, un exemple avec un texte d’une centaine de mots).

Résumer un texte préexistant (ici, le règlement européen pour la protection des données, synthétisé en cinq points).

Créer une checklist.

Résoudre un calcul.

Générer du code informatique, ou relever des erreurs dans du code déjà écrit (un usage particulièrement mis en avant depuis le lancement public de ChatGPT, et qui fait dire au CEO de Microsoft qu’une bonne partie du code informatique sera prochainement généré par des outils IA comme celui-ci).

Créer une histoire fictive de toutes pièces à partir de quelques paramètres.

Il existe des centaines d’autres possibilités. Retenez surtout que ChatGPT apporte son aide dans la réalisation d’un grand nombre de tâches, et que l’étendue de ses fonctionnalités grandit à mesure que des extensions voient le jour pour intégrer l’application à divers outils. À titre d’exemple, l’extension Chrome « Talk-to-ChatGPT » permet de poser ses questions à l’oral pour obtenir une réponse vocale – et ça marche parfaitement bien.

Quelles sont les limites de ChatGPT ?

Aussi brillant soit-il, le programme informatique mis en ligne par OpenIA est encore loin de convaincre. Oui, ses réponses sont étonnamment pertinentes. Oui, le contenu généré est bien structuré, et plutôt plaisant à lire. Oui, au global, l’application est bluffante, et la fascination médiatique qu’elle produit est justifiée. Mais c’est aussi un simple programme qui s’appuie sur des mécaniques déjà connues, bien qu’elles soient ici poussées jusqu’à leur paroxysme. Il est bon de rappeler que ChatGPT est un chatbot amélioré, mais pas encore une intelligence artificielle au sens où on l’entend communément : ce programme ne pense pas, ne raisonne pas, n’a pas d’opinion ou de ressenti, et n’a pas conscience de lui-même.

D’ailleurs, ChatGPT ne comprend pas vraiment ce que vous lui demandez : il interprète les mots dans leur contexte, en tire du sens, et produit une réponse à partir des termes qu’il a lui-même appris. Il ne construit pas des phrases à proprement parler, mais est entraîné à prédire quel mot doit être utilisé ensuite, en fonction d’une certaine probabilité. En somme, il ne comprend ni la question… ni sa propre réponse !

En outre, ses réponses sont parfois incomplètes, trompeuses, voire farfelues. Le fameux exemple des "œufs de vache" qui a largement circulé sur la Toile le prouve bien : l’application peut aisément être induite en erreur lorsque la question est posée de façon biaisée.

Ce ne serait pas un si gros problème si les réponses de ChatGPT n’étaient pas formulées avec aplomb et sans alternative. De fait, il n’y a pas de choix possible : le chatbot impose sa réponse, et basta – contrairement à ce que font les moteurs de recherche avec leurs pages de résultats, qui laissent aux internautes le choix entre une multitude de contenus pertinents. Sur des sujets plus sérieux que les œufs de vache, touchant à des problématiques réelles, un utilisateur peu prudent est enclin à se laisser duper. Le programme étant dans l’incapacité d’identifier ses propres erreurs, il n’est pas en mesure de vérifier la véracité des informations qu’il fournit. Par conséquent, mieux vaut connaître un minimum le sujet sur lequel vous l’interrogez… et apporter à l’application un maximum de contexte avant de poser la question fatidique.

Cette tendance à l’erreur pose d’autant de plus de problèmes que les géants du web se battent pour intégrer l’intelligence artificielle à leur moteur de recherche – et s’embourbent d’ores et déjà dans des défis éthiques d’une ampleur sans précédent. Comment ces nouveaux moteurs dopés à l’IA pourront-ils garantir l’exactitude factuelle de leurs résultats ? La vidéo de démonstration de Bing/ChatGPT a déjà fait l’objet de critiques quant à l’inexactitude des réponses fournies par l’application (cet article en est un exemple très complet) : celle-ci invente des chiffres en résumant un rapport financier, prête à des personnalités des talents qu’elles n’ont pas (un chanteur de rock japonais devient un poète célèbre), et se trompe dans les horaires d’ouverture des boîtes de nuit de Mexico.

Évidemment, ce ne sont là que des exemples anodins. Mais ils laissent entrevoir les questions qu’il faudra se poser lorsque l’IA sera massivement intégrée à nos usages, et qu’il deviendra impossible d’interroger un moteur de recherche sans obtenir une réponse unique et potentiellement fautive. En ce sens, ChatGPT est indéniablement une ouverture sur l’avenir… Mais nul ne peut dire, à ce jour, de quel avenir il s’agit.