Google vs ChatGPT : les coulisses d'un échec
Face à l'IA générative de langue d'OpenAI, le groupe de Mountain View a clairement un train de retard. Microsoft est le premier à tirer parti de la situation.
Officiellement lancé le 30 novembre 2022 par OpenAI, ChatGPT a pris Google de court. Certes le géant de Mountain View planchait depuis plusieurs mois déjà sur sa propre IA conversationnelle : LaMDA. Mais, alors même qu'il communiquait triomphalement sur les performances de cette technologie dès mai 2021, la maturité de cette dernière reste en retrait de celle de ChatGPT. Comment un acteur aussi réputé que Google dans l'IA s'est-il ainsi retrouvé dépassé alors même que ses équipes de R&D planchaient sur le sujet ? Retour sur quelques mois de folie dans les coulisses des deux géants.
Au sein des laboratoires d'OpenAI, le projet ChatGPT était en préparation depuis des années. Cette IA générative de texte s'adosse, rappelons-le, à GPT-3, un large language model (LLM) développé par OpenAI dès 2020. Comptant 175 millions de paramètres, ce réseau de neurones artificiels est entraîné sur un corpus de 8 millions de documents et 10 milliards de mots. "L'entrainement de ChatGPT a ensuite été affiné via la technique de l'apprentissage par renforcement à partir de feedbacks humains. Le patron d'OpenAI, Sam Altman, souhaitait ainsi s'assurer que les réponses livrées seraient correctes d'un point de vue éthique, mais aussi suffisamment qualitatives et rapides", explique Stéphane Roder, CEO d'AI Builders, cabinet français de conseil indépendant spécialisé en intelligence artificielle.
La première IA généraliste
On l'a vu. Le résultat va au-delà de toutes les espérances. "ChatGPT est une grande première. C'est la première fois qu'on se retrouve en présence d'une IA généraliste de traitement automatique de la langue", salut Didier Gaultier, directeur en data science et éthique de l'IA au sein de Busines & Decision, entité de l'ESN Orange Business spécialisée dans la data. "Les modèles de machine learning existants jusqu'ici sur ce terrain se limitaient à des IA spécialisées, capables de répondre à des problématiques centrées sur des domaines métier précis. ChatGPT, à l'inverse, est une IA universelle."
"A la différence de ChatGPT, Google Bard n'est pas encore entrainé"
Historiquement investisseur d'OpenAI à hauteur de 1 milliard de dollars, Microsoft a attendu début janvier 2023 pour annoncer son intention d'intégrer à son moteur de recherche Bing un équivalent de ChatGPT également signé OpenAI, et baptisé Prometheus. Aucune date de sortie n'a pour l'heure été communiquée. Ouvert à quelques bêta testeurs, l'assistant intégré par Microsoft (sous le nom de Sydney) enrichit Bing de réponses sur l'actualité chaude, ce que ChatGPT n'est pas capable de réaliser dans sa version initiale. Un coup de semonce pour Google. Pour enfoncer le clou, le groupe de Satya Nadella annonçait le 23 janvier son intention d'investir plusieurs milliards de dollars dans OpenAI. La somme pourrait s'élever à 10 milliards de dollars selon Bloomberg. Sous la pression des analystes financiers, Google dévoilait le 6 février son intention d'intégrer son propre assistant, Bard, à son moteur. Objectif affiché : "synthétiser divers sujets glanés sur le web pour produire des réponses actualisées et de qualité".
En amont du lancement de Bard, dont la date n'est pas encore connue, des "testeurs de confiance" ont pour mission d'assurer la qualité, la sécurité et la fiabilité des réponses de l'assistant. "Ce qui signifie qu'il n'est pas encore entrainé", déplore Stéphane Roder chez AI Builders. Google affiche donc un train de retard sur ChatGPT. A la différence de ce dernier qui est ouvert à tous, LaMDA, sur lequel Bard s'adosse, n'est proposé en effet qu'à un nombre limité d'utilisateurs via une bêta restreinte aux Etats-Unis. Baptisée AI Test Kitchen, elle est accessible via une application Android.
Mobilisation générale chez Google
Signe de l'urgence à redresser la barre, Prabhakar Raghavan, vice-président sénior de la recherche chez Google, a envoyé le 15 février dernier une note interne à ses salariés les incitant à contribuer à corriger les réponses de Bard. L'information vient confirmer une prise de position du PDG du groupe, Sundar Pichai, qui demandait par mail le même jour aux employés de passer deux à quatre heures de leur temps sur Bard, reconnaissant que la phase d'entrainement de l'assistant "sera un long voyage pour tout le monde". Pour la suite, le CEO ne cache pas ses intentions. "Vous verrez bientôt apparaître dans la recherche (de Google, ndlr) des fonctionnalités alimentées par l'IA distillant des informations complexes sous de multiples perspectives dans des formats faciles à digérer, et ce dans l'optique de comprendre rapidement une situation dans son ensemble", explique le PDG.
"Google n'a pas intérêt à investir massivement dans un nouveau produit, au risque de voir son retour sur profitabilité s'éroder mécaniquement"
Autre point faible de Google comparé à OpenAI, l'architecture de LaMDA se révèle plus complexe que celle de son concurrent. Avec comme priorité la gestion conversationnelle et moins la génération de texte, son réseau de neurones vectorise les termes ingérés lors de l'entrainement dans un espace beaucoup plus large, l'objectif principal étant de mieux contextualiser les requêtes. A cela s'ajoute une couche d'apprentissage par renforcement plus complexe également, laissant moins de place aux formateurs humains que ne le fait ChatGPT. "Globalement, un modèle plus simple ingérant des données d'entrainement plus volumineuses comme c'est le cas de ChatGPT a globalement beaucoup plus de chance d'être plus performant", affirme Didier Gaultier chez Orange Business.
Avec ses 3% de part de marché dans la recherche en ligne, Microsoft n'a rien à perdre et tout à gagner face à Google qui en totalise 93% (selon les derniers chiffres de Statcounter). En parallèle, l'éditeur de Windows envisage d'intégrer l'IA d'OpenAI à Word, PowerPoint et Teams. Selon nos confrères de The Verge, la démonstration d'une intégration de Prometheus dans Word, PowerPoint et Outlook serait pour bientôt. Techniquement, Prometheus serait potentiellement déjà utilisable dans les applications web d'Office via la barre de recherche Bing reprise sur leurs interfaces. D'après The Verge, Microsoft tablerait sur des cas d'usage de ChatGPT à tous les étages d'Office, de la génération de textes dans Word à celle de graphiques dans Excel en passant par la production de présentations dans PowerPoint.
Du côté de Google, aucune information n'a pour le moment fuité sur de potentiels projets équivalents dans la suite de productivité Workspace.
Microsoft pourrait tenter le tout pour le tout
Alors qu'il vient tout juste d'inaugurer la version payante de ChatGPT, OpenAI communique déjà sur la prochaine étape : doter son IA générative d'une API. Une interface de programmation qui permettra d'intégrer et d'adapter ChatGPT à des applications tierces, voire de l'entrainer sur des jeux de données métier spécifiques à un secteur ou un projet particulier.
"De son côté, Google n'est pas incité financièrement à innover", maintient Didier Gaultier. Son moteur de recherche reste une vache à lait. "Comme dans les années Steve Ballmer chez Microsoft durant lesquelles le groupe de Redmond rechignait à toucher à Windows et Office, Google n'a pas intérêt à innover et investir massivement dans un nouveau produit, au risque de voir son ROCE (pour return on captital employed, ndlr) s'éroder mécaniquement sur le search", poursuit le directeur en data science de Busines & Decision.
A l'inverse, Microsoft, avec la faible part de marché de Bing, pourrait tenter le tout pour le tout. Avec à la clé pour ambition de voir son ROCE, à l'inverse, progresser dans le search mais aussi sur le terrain de la suite Office. Et ce ne sont pas les seuls segments que l'éditeur a en ligne de mire. En janvier 2023, Microsoft a ainsi étendu son partenariat avec OpenAI et décroché l'exclusivité de la distribution en mode cloud des technologies d'OpenAI : GPT-3.5, Codex, Dall-E 2... Des briques qu'il commercialise déjà via ses Azure OpenAI Services. Quant à ChatGPT, Microsoft prévoit de l'intégrer à son cloud "prochainement". Là encore, l'entreprise de Satya Nadella se garde bien d'être plus précise en termes de date. Seule certitude : ce sera en 2023.