Bard vs ChatGPT vs Claude 2 : quelle IA générative est faite pour vous ?
Quelles sont les principales différences entre les chatbots de Google, OpenAI et Anthropic ? La réponse en tableau.
Depuis des mois désormais, les acteurs de l'IA générative bataillent pour développer un chatbot compétitif. Une course à l'intelligence artificielle dominée par trois acteurs, OpenAI, Google et Anthropic, qui s'est accélérée en juillet. OpenAi a dégainé le premier en sortant son plugin Code Interpreter le 7, Anthropic lui a emboîté le pas le 11 en dévoilant son nouveau modèle Claude 2, beaucoup plus efficient que la première version, avant que dans la foulée, le 13, Google déploie en Europe Bard, avec la prise en charge de la multimodalité basée sur Google Lens. Comme toute course entre champion, celle-ci s'avère difficile à suivre. Voici donc ci-dessous un point d'étape sur les capacités de chacun.
ChatGPT |
Bard |
Claude 2 |
|
---|---|---|---|
Développeur |
OpenAI |
|
Anthropic |
Disponible en France |
Oui |
Oui |
Non |
Multimodalité |
Oui, avec Code Interpreter |
Oui, en Anglais |
Oui |
Fonctionnalités premium |
GPT-4, priorité d'accès, plugin, Code Interpreter |
Non |
Non |
Longueur de prompt théorique |
30 000 mots (avec GPT-4) |
10 000 mots |
75 000 mots |
Dernière mise à jour "officielle" des données |
Septembre 2021 |
Temps réel |
Début 2023 |
OpenAI API |
Cloud's AI Trusted Tester Program |
Anthropic API |
|
Connexion à internet |
Non |
Oui |
Non |
Prix de l'API |
Entre 0,03 $ et 0,06 $ / 750 mots |
ND |
0.0465 $ / 1 000 mots |
Plugin(s) disponible(s) |
Oui |
Non |
Non |
Qualité du texte généré en français |
Haute |
Bonne |
Faible |
Éthique du modèle |
Moyenne |
Bonne |
Bonne |
Temps de réponse |
Moyen (avec GPT-4) |
Rapide |
Rapide |
Nombre de paramètres |
530 millions |
1,3 million |
1,6 million |
Quel modèle faut-il choisir aujourd'hui et pour quel usage ?
Pour le moment, seuls ChatGPT - et ses modèles sous-jacents GPT-4 et GPT-3.5 - et Claude 2 sont destinés à un usage professionnel. Bard ne dispose pas encore d'API ouverte au public, les éditeurs sont dans l'obligation de s'inscrire sur le Cloud's AI Trusted Tester Program de Google pour réussir à intégrer Bard à leurs applications. Du côté d'Anthropic et d'OpenAI, l'intégration est beaucoup plus simple. Il suffit de créer un compte et de renseigner les informations de facturation pour utiliser l'API.
Côté multimodalité, les trois modèles sont maintenant capables de traiter des fichiers en entrée de prompt. Bard réserve la possibilité d'uploader des images pour les analyser mais uniquement dans sa version anglophone. ChatGPT peut traiter différents types de fichier, des images aux fichiers PDF en utilisant Code Interpreter. Claude 2 permet également de soumettre des fichiers textuels (PDF, CSV, DOCX…).
Quel modèle est le plus qualitatif ?
D'un point de vue qualitatif, GPT-4 continue de proposer des réponses plus structurées avec un langage riche et un contexte pertinent. De son côté Bard semble suivre la logique de la transformation des Serp et propose de l'information très pratique, souvent brève et présentée sous forme de liste à puce. Enfin Claude 2 répond très classiquement mais, en français, son vocabulaire est peu diversifié et ses informations moins pertinentes.
Concernant la fraîcheur des informations, Bard gagne haut la main. L'IA de Google étant connectée à Internet, elle génère des réponses plus récentes mais manque encore de fiabilité. Lors de nos tests, le chatbot a été victime d'hallucination à de multiples reprises. Claude 2 ne fait pas beaucoup mieux mais semble toutefois moins sujet à l'AI hallucination. Ses données ont le mérite d'être plus à jour que celles des modèles d'OpenAI, l'IA ayant emmagasiné son dataset jusqu'en début d'année 2023. Enfin ChatGPT - bien qu'il ne dispose plus d'un accès au web - répond de manière générale plutôt correctement, mais ses données, arrêtées en septembre 2021, l'handicapent fortement.
Dans la majorité des cas, l'intégration de l'IA générative dans l'applicatif ne nécessite pas de données récentes. Il semble alors pertinent de recourir à Claude 2 pour des tâches basiques en raison de son faible coût et à GPT-4 pour des tâches plus complexes. Enfin de manière alternative, les modèles de précédentes générations chez OpenAI - à l'image de text-curie-001, text-babbage-001 ou encore text-ada-001 - sont suffisants pour gérer des tâches élémentaires comme de la traduction, le classement ou encore de la synthèse. Leur rapidité et leur rapport qualité / prix en font des modèles toujours incontournables en 2023.