Cette semaine, la série “Le Saviez-Vous ?” évoquera ChatGPT : qu’est-ce que cet outil/plateforme dont le monde parle, pourquoi il est peut-être l’outil le plus important depuis le lancement des moteurs de recherche modernes, et surtout comment peut-on l’utiliser et l’intégrer à votre stratégie d’acquisition payante ? Mais laissons la publicité payante de côté pour le moment, et répondons d’abord à cette question : comment (et doit-on) l’intégrer à une stratégie d’acquisition en ligne ?
L’entreprise OpenAI – société destinée à promouvoir et développer une intelligence artificielle, a développé une forme d’IA avancée dont le but est de répondre aux questions les plus complexes des internautes, et ce de manière conversationnelle.
C’est une technologie révolutionnaire car elle a été créée dans le but de comprendre ce que les humains veulent dire lorsqu’ils posent une question.
De nombreux utilisateurs de la solution sont impressionnés par sa capacité à fournir des réponses de qualité, inspirant le sentiment qu’elle pourrait éventuellement provoquer un changement dans la manière d’interagir entre humains et ordinateurs, mais surtout de modifier la façon dont les informations sont traitées.
Qu’est-ce que ChatGPT ?
ChatGPT est un chatbot – aussi nommé dialogueur ou agent conversationnel, est un agent logiciel qui dialogue avec un utilisateur (https://fr.wikipedia.org/wiki/Chatbot), développé par OpenAI et basé sur GPT-3.5 – Generative Pre-trained Transformer 5, un modèle de langage.
Les grands modèles de langage ont pour tâche de prédire le mot suivant dans une série de mots (comme par exemple l’outil de suggestion de recherche de Google).
L’apprentissage par renforcement avec rétroaction humaine – Reinforcement Learning with Human Feedback (RHLF), est une couche supplémentaire d’apprentissage automatique qui utilise la rétroaction humaine pour aider ChatGPT à apprendre à suivre les instructions et générer des réponses satisfaisantes à ses utilisateurs.
Qui a créé ChatGPT ?
Comme expliqué plus haut, ChatGPT a été créé par la société d’intelligence artificielle OpenAI basée à San Francisco. OpenAI Inc. est la société mère à but non lucratif de la société à but lucratif OpenAI LP et fondée, notamment, par Elon Musk et Sam Altman.
OpenAI est célèbre pour son célèbre DALL·E, un modèle d’apprentissage en profondeur qui génère des images à partir d’instructions textuelles appelées invites.
Microsoft est un partenaire et un investisseur d’un montant de 1 milliard de dollars. Ils ont développé conjointement la plate- forme Azure AI (plateforme commerciale de Microsoft proposant diverses solutions business basée sur l’IA).
Grands modèles de langage
Comme nous l’évoquions, ChatGPT est un grand modèle de langage – large language model (LLM). Les grands modèles de langage sont formés avec des quantités massives de données pour prédire avec précision quel mot vient ensuite dans une phrase.
Il a été découvert que l’augmentation de la quantité de données augmentait la capacité des modèles de langage à en faire plus.
L’Université de Stanford a mis en relation les quantités de paramètres des différentes versions de modèles de chatbot, établissant un lien entre la masse de paramètres et les capacités du modèles qui deviennent “capables d’effectuer des tâches pour lesquelles il n’ont pas été explicitement formés, comme la traduction de phrases de l’anglais au français, avec peu ou pas d’exemples de formation.”
Les grands modèles de langage prédisent le mot suivant dans une série de mots dans une phrase et les phrases suivantes – comme la saisie semi-automatique, mais à dimension tout autre.
Cette capacité leur permet d’écrire des paragraphes et des pages entières de contenu.
Mais les grands modèles de langage sont limités par leur incapacité à vraiment cerner ce qu’un humain veut (ou veut dire) dans sa recherche.
Et c’est là que ChatGPT perfectionne continuellement son art, avec la formation d’apprentissage par renforcement avec rétroaction humaine (RLHF).
Comment ChatGPT a-t-il été formé ?
GPT-3.5 a été formé sur des quantités massives de données sur le code et les informations provenant d’Internet, y compris des sources telles que les discussions sur le réseau social Reddit, pour aider ChatGPT à apprendre le dialogue et à atteindre un style de réponse humain.
ChatGPT a également été formé à l’aide de la rétroaction humaine (comme évoqué plus haut, la RLHF) afin que l’IA apprenne ce que les humains attendaient lorsqu’ils posaient une question. La formation du grand modèle de langage de cette manière est révolutionnaire car elle va au-delà de la simple formation du grand modèle de langage pour prédire le mot suivant.
Le but affiché des équipes de recherche (Training language models to follow instructions with human feedback) était de créer un modèle capable de “suivre l’intention d’un utilisateur”.
Ce qui distingue ChatGPT d’un simple chatbot, c’est qu’il a été spécialement formé pour comprendre l’intention humaine dans une question et fournir des réponses “utiles, véridiques et inoffensives.”
En raison de cette formation, ChatGPT peut contester certaines questions et ignorer certaines parties qui n’ont pas de sens.
Un autre document de recherche lié à ChatGPT montre comment elles ont formé l’IA pour prédire ce que les humains préféraient.
Les chercheurs ont remarqué que les métriques utilisées pour évaluer les résultats de l’IA de traitement du langage naturel entraînaient des machines qui obtenaient de bons résultats sur les métriques, mais ne correspondaient pas à ce que les humains attendaient.
La solution qu’ils ont donc conçue était de créer une IA capable de produire des réponses optimisées en fonction des préférences humaines.
Pour ce faire, ils ont formé l’IA à l’aide d’ensembles de données de comparaisons humaines entre différentes réponses afin que la machine devienne meilleure pour prédire ce que les humains jugeaient être des réponses satisfaisantes.
Le journal partage que la formation a été réalisée en résumant les publications de Reddit et également testée sur la synthèse des actualités (Learning to summarize from human feedback).
Quelles sont les limites de ChatGPT ?
Limites de la réponse toxique
ChatGPT est spécifiquement programmé pour ne pas fournir de réponses toxiques ou nuisibles. Il évitera donc de répondre à ce genre de questions – Microsoft a bien tiré les leçons de son expérience douloureuse avec Tay, le chatbot lancé sur Twitter, et devenu néo-nazi en quelques heures.
La qualité des réponses dépend de la qualité des instructions
Une limitation importante de ChatGPT est que la qualité de la sortie dépend de la qualité de l’entrée. En d’autres termes, les instructions d’experts (invites) génèrent des réponses plus pertinentes.
Mais ChatGPT étant une plateforme ouverte à tous, rien n’empêchera des utilisateurs mal intentionnés (ou trolls) de multiplier les entrées peu pertinentes afin de nourrir l’IA avec de fausses données.
Les réponses ne sont pas toujours correctes
Parce qu’il est formé pour fournir des réponses qui semblent justes aux humains, les réponses peuvent se révéler trompeuses car la sortie (réponse à la question) est correcte, elle ne répond juste pas à la bonne question !
De nombreux utilisateurs ont découvert que ChatGPT peut fournir des réponses incorrectes, dont certaines peuvent être extrêmement erronées.
Les modérateurs du site Web de questions-réponses sur le codage Stack Overflow ont malheureusement expérimenté cette limitation, dans la douleur, en Décembre dernier.
Stack Overflow a été inondé de réponses d’utilisateurs générées à partir de ChatGPT qui semblaient être correctes, mais un grand nombre étaient de mauvaises réponses.
Des milliers de réponses ont submergé l’équipe de modérateurs bénévoles, incitant les administrateurs à interdire tout utilisateur qui publie des réponses générées à partir de ChatGPT.
OpenAI explique les limites de ChatGPT
OpenAi avait anticipé le manque de pertinence de certaines réponses ainsi que les limites de son bébé. Dans un premier communiqué, il était dit « ChatGPT écrit parfois des réponses plausibles mais incorrectes ou absurdes.”
Résoudre ce problème est difficile, car :
- Pendant la formation RL (real life), l’outil traite une quantité de données énorme, et en majorité du contenu généré par l’utilisateur, qui peut donc être erroné. Dans cette phase, il n’y a aucune source de vérité.
- Entraîner le modèle à être plus prudent pourra l’amener à refuser les questions auxquelles il peut répondre correctement – un peu comme, lorsque vous vous rendez compte que votre quantité de courrier indésirable augmente de jour en jour, et que vous décidez de revoir à la hausse votre protection anti-spam : il se peut que, par la suite, soient considérés comme du courrier indésirables des emails parfaitement légitimes.
- Une formation supervisée risque d’induire le modèle en erreur car la réponse idéale dépend de ce que sait le modèle, plutôt que de ce que sait le démonstrateur humain, le serpent se mordant la queue …
Est-ce que ChatGPT est gratuit ?
L’utilisation de ChatGPT est actuellement gratuite pendant la période de « prévisualisation de la recherche ».
Le chatbot est actuellement ouvert aux utilisateurs pour essayer et fournir des commentaires sur les réponses afin que l’IA puisse mieux répondre aux questions et apprendre de ses erreurs.
Dans une annonce officielle, OpenAI encourage les utilisateurs à laisser leurs commentaires pour permettre au système d’apprendre de ses erreurs : “Les utilisateurs sont encouragés à fournir des commentaires sur les sorties de modèles problématiques via l’interface utilisateur” et identifier les “faux positifs/négatifs du filtre de contenu externe”
Les modèles linguistiques remplaceront-ils la recherche Google ?
Google lui-même a déjà créé un chatbot IA qui s’appelle LaMDA . Les performances du chatbot de Google étaient si proches d’une conversation humaine qu’un ingénieur de Google a affirmé que LaMDA était sensible (l’apprentissage est tel que de nombreuses questions – notamment celle de son utilisation, qui doit restée propre, se posent).
Étant donné que ces grands modèles de langage peuvent répondre à tant de questions, est-il exagéré qu’une entreprise comme OpenAI, Google ou Microsoft remplace un jour la recherche traditionnelle par un chatbot IA ?
Certains sur Twitter déclarent déjà que ChatGPT sera le prochain Google.
Le scénario selon lequel un chatbot de questions-réponses pourrait un jour remplacer Google est effrayant pour ceux qui gagnent leur vie en tant que professionnels du marketing de recherche, mais ce scénario reste plausible.
La technologie a encore un long chemin à parcourir, mais il est possible d’envisager un avenir hybride de recherche et de chatbot pour la recherche.
Cependant, l’implémentation actuelle de ChatGPT nous porte à croire que, à l’issue de la phase de « prévisualisation de la recherche », l’outil nécessitera l’achat de crédits à utiliser – alors que l’utilisation du moteur de recherche est, pour le moment, gratuite.
Comment ChatGPT peut-il être utilisé ?
ChatGPT peut écrire du code, des poèmes, des chansons et même des nouvelles dans le style d’un auteur spécifique.
Cette expertise fait passer ChatGPT du rang de source d’information à un outil à proprement parler, utilisé pour accomplir une tâche.
Ainsi, il fournira une réponse pour pratiquement toutes les tâches auxquelles on peut répondre avec un texte écrit.
Comme mentionné précédemment, ChatGPT est envisagé comme un outil que le public devra éventuellement payer pour l’utiliser.
Alors, simple effet de mode ou véritable futur de la recherche en ligne ? L’avenir nous le dira mais, ce qui est sûr, c’est que l’engouement autour de la plateforme a été tel que plus d’un million d’utilisateurs se sont inscrits pour utiliser ChatGPT dans les cinq premiers jours depuis son ouverture au public.
Besoin d’y voir plus clair dans votre stratégie de Marketing en ligne ? RLDC vous accompagne dans :
- Recommandation et mise en place des propositions de stratégie de marketing en ligne : mise en œuvre et création, gestion et optimisation de campagnes sur les plateformes de référencement payant (Google Ads – Search, Display, Shopping, Gmail, BingAds et YahooAds) et les plateformes sociales (YouTube, FacebookAds, InstagramAds, LinkedinAds, TikTok, Snapchat)
- Suivi de la gestion et de l’optimisation sur les plateformes Analytics (Google Analytics, Adobe Omniture, Eulerian Analytics ..)
- Intégration (via Google Tag Manager) ou audit du tracking existant et suivi de la performance sur votre site
- Audit et optimisation des comptes publicitaires existants (référencement payant, social, Analytics)
- Formation (Media Payant et Analytics) : faites monter en compétences vos équipes en interne
N’hésitez pas à nous contacter pour une recommandation personnalisée et adaptée à vos besoins !