ChatGPT : fin de l'exclusivité humaine dans la rédaction de texte ?
ChatGPT et en particulier le modèle de langage GPT4 sont des modèles de langage de pointe qui révolutionnent le domaine de l'intelligence artificielle et en particulier le processus de création de texte. Ces modèles sont capables de générer des textes qui semblent être presque indiscernables de ceux écrits par un humain.
Par ailleurs, ceux qui disposent d'un compte ChatGPT Plus peuvent désormais facilement charger des PDF à l'aide d'un plug-in comme "File Upload for ChatGPT" 🇫🇷 (https://fileforchatgpt.xyz/). Et donc faire exploiter tout le potentiel de ChatGPT sur des documents personnels... ou de l'entreprise ! 😱
Du coup, on m'a posé plusieurs fois la question ces derniers jours sur les méthodes de détection de contenus générés par l'IA et par ailleurs l'identification de potentielles fuites de données vers OpenAI...
Alors, les contenus générés par une IA sont-ils vraiment indétectables ? et pourrait-on à minima identifier des contenus écrits à 100% par un humain comme celui que vous êtes en train de lire 😉 ?
J'ai fait mes tests avec trois textes différents :
J'ai fait mes tests sur la base de 5 outils pour disposer d'un panel suffisament représentatif :
Recommandé par LinkedIn
Pour vous faire gagner du temps, la liste est classée par ordre de pertinence.
Du coup, parlons principalement de ZeroGPT et OpenAI Text Classifier.
ZeroGPT est un outil de détection d'IA qui se démarque par sa sensibilité. Il parvient à identifier avec succès une part significative des textes produits par GPT3.5 et GPT4 en tant que contenus générés par l'IA. Cependant, cette sensibilité peut être perçue comme un inconvénient, car elle peut conduire à des faux positifs, c'est-à-dire des détections d'IA là où il n'y en a pas réellement. Cette situation peut poser problème pour les utilisateurs qui souhaitent vérifier l'authenticité d'un contenu. À noter toutefois que les textes générés par GPT4 sont plus difficilement détectés ce qui marque l'évolution dans la formulation des réponses générées par la dernière version du modèle d'OpenAI.
L'outil de détection d'IA officiel d'OpenAI retrouve pratiquement à 100% les textes générés par GPT3.5 qui constituent à ce jour la très grande majorité d'usage de ChatGPT actuellement. GPT4 n'étant qu'accessible par les utilisateurs ayant souscrit à l'offre payant ChatGPT Plus. Les textes générés par GPT4 sont de mieux en mieux identifiés ce qui matérialise le fait qu'OpenAI met régulièrement à jour son outil de détection. Néanmoins, il est important de souligner que même cet outil n'est pas infaillible et qu'il reste possible de le tromper à l'aide d'un texte suffisamment bien conçu.
Conclusion de mes tests
La détection de textes générés par IA est un domaine en constante évolution. Les outils de détection doivent constamment s'adapter aux nouvelles versions des générateurs de texte comme GPT3.5 et GPT4.
Il est important de noter que la langue du texte peut également influencer la détection. Le français apporte une difficulté supplémentaire pour les détecteurs...
Si je ne devais qu'en recommander un, ce serait ZeroGPT. Il présente, sur la base de mes propres expérimentations, les moyens résultats et aussi l'intérêt d'une certaine indépendance vis-à-vis d'OpenAI...