ChatGPT vulgarisé : pour comprendre les possibilités, il faut comprendre comment ça fonctionne !
Jonathan Kemper

ChatGPT vulgarisé : pour comprendre les possibilités, il faut comprendre comment ça fonctionne !

Ces dernières semaines, il ne se passe pas un jour sans qu’on parle de ChatGPT et de ses possibilités infinies, mais aussi de ses limitations. Je pense qu’il est donc nécessaire de mieux comprendre comment cela fonctionne pour en comprendre les possibilités et les limites.


Ce qu’il faut comprendre en premier lieu, c’est que ChatGPT n’est pas une giga base de données remplie de millions de livres et de contenus, il comprend notre langage, ou du moins il sait le lire.


Et pour cela, il a appris, ou plutôt il a vectorisé ces contenus sur une base statistique.


La vectorisation des contenus : transformer les mots en nombres

La vectorisation des contenus, c'est comme transformer les mots en nombres pour que ChatGPT puisse les comprendre. Chaque mot a son propre groupe de nombres qui lui correspond, et ces nombres aident ChatGPT à comprendre ce que signifie le mot et comment il est lié à d'autres mots. 


ChatGPT a vectorisé des millions de textes provenant de sources variées comme des articles, des livres, des blogs et des sites web pour apprendre notre langage.


Même s’il n’est pas capable de se représenter les concepts qui se cachent derrière les mots, il a défini pour chaque mot des attributs, qu’il a lui-même créés pour développer sa compréhension.


Comme le cerveau humain, dès que nous voyons un visage, par exemple, nous avons une série d’attributs qui nous viennent en tête tels que la taille des yeux, la forme de la bouche, la couleur de cheveux, etc.. C’est cela qui nous permet de différencier deux personnes.


Les attributs d'un mot sont comme des étiquettes qui décrivent ce que le mot représente. Par exemple, pour le mot "chat", les attributs pourraient être "animal", "mignon" et "ami des humains". ChatGPT apprend ces attributs en étudiant les textes qu'il lit.


Cette étape est probablement la plus complexe à comprendre, car c’est justement ce processus qui permet aujourd’hui d’arriver à une solution générative de contenus. L’outil est capable de produire de nouveaux contenus contrairement à des intelligences artificielles précédentes.


Et pour répondre aux questions que vous lui posez, il ne va donc pas « réfléchir » ou aller chercher une réponse toute faite dans une base de données géante, mais il va « imaginer » une réponse basée sur des probabilités statistiques.


Des probabilités plus que des réponses

ChatGPT utilise les probabilités statistiques pour trouver les meilleures réponses possibles. Il ne sait pas tout, mais il peut utiliser ce qu'il a appris pour deviner les mots et les phrases qui semblent les plus adaptés à la question posée.


Pour choisir les mots qui se suivent de manière logique, ChatGPT analyse les combinaisons de mots qu'il a vues dans les textes qu'il a lus. En se basant sur ces observations, ChatGPT "devine" quels mots ont le plus de chance d'être utilisés ensemble.


Ainsi, si nous reprenons l’exemple du mot "chat" pour illustrer comment ChatGPT fonctionne, lorsque ChatGPT lit des textes sur Internet, il rencontre souvent des phrases qui parlent de chats. En analysant ces phrases, il apprend les caractéristiques communes associées aux chats, comme "animal", "mignon" et "ami des humains ». Il ne comprend pas ces mots, mais il déduit que ces mots qui reviennent régulièrement dans les contenus sont des « attributs » qu’il peut associer à ce mot et retient avec quels autres mots ils sont combinés. Il crée donc une toile très complexe de liens entre tous les mots de la langue.


Par exemple, ChatGPT peut lire des phrases comme "Les chats sont des animaux domestiques", "Les chats sont des félins" ou "Les chats aiment jouer avec des jouets". Ces caractéristiques deviennent des attributs du mot "chat".


Lorsque ChatGPT doit répondre à une question ou parler d'un chat, il utilise ces attributs pour créer une réponse appropriée. Par exemple, si on lui demande "Qu'est-ce qu'un chat ?", il pourra répondre : "Un chat est un animal domestique et un félin qui aime jouer avec des jouets ».


Comprendre les possibilités et les limites

ChatGPT est une intelligence artificielle incroyable qui utilise des techniques spéciales pour comprendre et parler notre langage. En transformant les mots en nombres grâce à la vectorisation des contenus, en apprenant les attributs des mots à partir des millions de textes qu'il a vectorisés, et en utilisant les probabilités statistiques pour trouver les meilleures réponses, ChatGPT peut discuter avec nous sans avoir besoin d'une base de données. 


Mais cela implique aussi que ChatGPT ne peut pas « inventer » de nouveaux concepts. Il peut créer des liens entre des informations que nous n’avions pas forcément reliées, mais il est incapable de créativité innée. Il faut donc être conscient que ChatGPT peut être considéré comme un ami qui a lu énormément de livres et de contenus, et à qui on peut demander « Tiens, je me demande ce que je dois faire pour développer les ventes de mon site e-commerce ? » et qui répondrait, de manière très pragmatique, la table des matières d’un livre sur le marketing digital avec le top 5 des bonnes pratiques, mais sans réel contexte.


De plus, vous comprendrez aisément qu’il est impossible à un outil tel que chatGPT de citer de manière exhaustive les sources de ses différentes réponses, car il ne stocke pas les contenus dans une base de données, mais il les trient et créé des liens logiques entre eux.


Évidemment, tout ceci va évoluer, et évolue même tous les jours, et permettra rapidement d’intégrer le contexte spécifique de chaque société et ses données business. Encore faudra-t-il voir quelles données vous pourrez fournir, car comme vous avez pu le comprendre, si les données rentrées ne sont pas qualitatives ou trop éparses, les réponses le seront tout autant.


J’espère qu’avec ces quelques lignes vous aurez une meilleure compréhension du fonctionnement d’un outil tel que ChatGPT et surtout, que vous pourrez vous préparer aux futures évolutions promises dans le domaine de l’intelligence artificielle. J’aurais encore l’occasion de vous en parler dans les prochaines semaines.


Cedric/c

Chris Lefevre

𝗖𝗧𝗢 & 𝗗𝗶𝗴𝗶𝘁𝗮𝗹 𝗦𝗽𝗲𝗰𝗶𝗮𝗹𝗶𝘀𝘁 at 𝗰𝗲𝗹𝗲𝘀𝘁𝗲𝘁𝗶𝗰. 𝘑𝘦 𝘱𝘢𝘳𝘵𝘢𝘨𝘦 𝘥𝘦𝘴 𝘢𝘤𝘵𝘶𝘴 𝘐𝘈 𝘦𝘵 𝘋𝘪𝘨𝘪𝘵𝘢𝘭 𝘔𝘢𝘳𝘬𝘦𝘵𝘪𝘯𝘨

1 ans

En passant,le fait qui ressort pas des données copier coller d’une DB explique pourquoi il fait autant d’erreurs ( j’ai rarement un script qui fonctionne du premier coup avec GPT ) mais c’est également ce qui le rend plus intéressant quand il n’est pas lié à un moteur de recherche comme Bing, car il peut tout de même proposer des solutions créatives à certains problèmes, en mélangeant plusieurs idées.. et d’ailleurs, est-on certains que nous soyons capables d’inventer des choses sans mélanger également des concepts que l’on aurait appris ou découvert auparavant ?

Thibault L.

Primento / Mardaga éditions 🚀

1 ans

Merci Cédric. Très bien résumé.

Omid Hachem Samii

Helping companies navigate and manage change with agility and efficiency. Building also the Future of Energy | Co-Founder at Uni Energy | Administrator

1 ans

Magnifique ! Simple et très intéressant Merci pour ce partage !

Philippe Deliège

Builder of influencer | #PersonalBranding | Auteur | Speaker +32 477 67 38 09 | estocada.

1 ans

Merci

Identifiez-vous pour afficher ou ajouter un commentaire

Plus d’articles de Cédric Cauderlier

Autres pages consultées

Explorer les sujets