Utilisateur non connecté
5 indices pour reconnaître un texte géné ...Les chatbots imitent de mieux en mieux le langage humain, mais ils ont encore des imperfections. [ElseNews]

Outils pour utilisateurs

Outils du site


elsenews:spot-2025:12:demasquer-ia

5 indices pour reconnaître un texte géné ...Les chatbots imitent de mieux en mieux le langage humain, mais ils ont encore des imperfections.

A retenir

Les modèles d'IA suivent certaines règles structurelles lorsqu'ils génèrent du texte.
Cela facilite leur identification.
Ils ont tendance à privilégier les contrastes, par exemple : « Ce n'est pas X, c'est Y. »

Ces dernières années, Internet a été inondé de textes générés par l'IA. À mesure que les modèles qui les utilisent s'améliorent, leur capacité à imiter les subtilités du langage humain s'affine. Parallèlement, nos méthodes de détection progressent et un dialogue en ligne actif s'est instauré autour des particularités les plus courantes de ces textes.
Historiquement, l'un des indices les plus connus de ChatGPT, par exemple, est son utilisation fréquente du tiret cadratin. Il ponctuait souvent ses phrases de sauts de ligne délimités par des tirets pour souligner un point en y insérant des arguments à l'appui au milieu des phrases d'une manière qui, pour certains utilisateurs, semble archaïque et mécanique.
À la suite des critiques sur la propension de ChatGPT à utiliser le tiret, Sam Altman, PDG d'OpenAI, a annoncé le mois dernier que ChatGPT cesserait d'utiliser ce signe de ponctuation dans ses productions si l'utilisateur le lui demandait. Si de nombreux utilisateurs ont probablement accueilli favorablement cette nouvelle, elle a également rendu la détection des textes générés par le chatbot beaucoup plus difficile. Une mauvaise nouvelle pour les enseignants, de nombreux employeurs et tous ceux pour qui il est important de disposer d'un moyen fiable de distinguer les textes générés par des humains de ceux générés par une IA.
Si vous cherchez à aiguiser votre capacité à identifier rapidement un texte généré par une IA, voici quelques schémas linguistiques à surveiller.
Cinq indicateurs révélateurs d'un texte généré par une IA
La règle de trois
Les auteurs humains présentent souvent leurs arguments en citant trois exemples, ce qui semble répondre à un besoin psychologique profond : un exemple est un hasard, deux une coïncidence, trois une habitude. L'IA fait la même chose, mais à une échelle absurde. Les triplets apparaissent fréquemment dans ses productions. Par exemple, prenons ce paragraphe d'introduction de ChatGPT après que je lui ai demandé de présenter son meilleur argument possible selon lequel la Terre est un disque plat (il a d'abord précisé que sa réponse était purement « un exercice rhétorique » et qu'il ne soutenait pas explicitement la théorie de la Terre plate) :
Si la Terre était un globe tournant à des milliers de kilomètres par heure, sa courbure serait directement observable au quotidien. Pourtant, des observations à longue distance au-dessus des lacs, des déserts et des océans montrent régulièrement que les objets – navires, rivages, bâtiments – apparaissent exactement là où ils devraient être si la surface était plane. Les ingénieurs tiennent compte de la courbure en théorie, mais en pratique, les géomètres, les pilotes et les équipes de construction se basent sur des mesures de niveau qui se comportent comme si la Terre était un plan étendu. L'explication la plus simple de cette cohérence est que le sol sous nos pieds n'est pas du tout courbé.
Cela représente trois groupes de trois éléments dans une phrase de 90 mots.
Arguments formulés dans un langage contrasté
Les chatbots tentent souvent de convaincre en présentant d'abord un contrepoint. Prenons l'exemple de cette réponse de ChatGPT lorsque je lui ai demandé un argumentaire de vente pour une entreprise proposant des vols commerciaux vers Mars : « Mars n'est pas qu'une planète, c'est votre prochaine destination inoubliable. » Difficile d'imaginer un auteur humain écrire une phrase comme « Mars n'est pas qu'une planète… »
Structure de phrase monotone
Les textes générés par l'IA ont tendance à être uniformes. Bien qu'il y ait, bien sûr, quelques variations, les phrases sont souvent de longueur sensiblement égale, ce qui donne des paragraphes trop courts. Les auteurs humains s'efforcent généralement d'apporter un peu de variété en variant la longueur de leurs phrases et de leurs paragraphes. Essayez de lire à voix haute un texte suspect : si le rythme vous paraît robotique, c'est probablement le cas.
Vous suivez l’actualité grâce à l'IA ? Attention, la fiabilité n’est pas au rendez-vous
Questions rhétoriques courtes et inutiles
Les phrases générées par l’IA n’ont pas toujours la même longueur. Les chatbots ont souvent tendance, pour une raison obscure, à glisser des questions très courtes (un ou deux mots). Du genre : « Et honnêtement ?» J’ai constaté ce problème lorsque j’ai récemment demandé à ChatGPT un résumé humoristique de ma personnalité, basé sur nos conversations de l’année précédente. Et quand j’ai demandé une description amusante des Rocheuses, sa réponse a notamment été : « La faune ? Oh, ils se contentent de juger vos choix de goûters avec désinvolture : les élans avec dédain, les marmottes avec insolence.» Il serait absurde qu’un humain commence cette phrase par une question, puisque personne n’a posé de question sur la faune. Il serait bien plus simple d’écrire : « La faune se contente de juger… »
Atténuation constante
Alors que les rédacteurs humains ont tendance à se concentrer sur un point précis, les chatbots ont tendance à utiliser un langage indirect et atténuant, ainsi que des qualificatifs (« Cela pourrait signifier… » ou « peut-être… »), ce qui donne souvent l’impression de fournir une évaluation nuancée et équilibrée, mais qui se traduit en réalité par une réponse vague et décousue.
https://www.zdnet.fr/pratique/comment-demasquer-lia-5-indices-pour-reconnaitre-un-texte-genere-par-chatbot-487145.htm

× iphelper toolbox

you see this when javscript or css is not working correct

Untested
IP Address:
First usable:
Subnet:
Last usable:
CIDR:
Amount of usable:
Network address:
Reverse address:
Broadcast address:

elsenews/spot-2025/12/demasquer-ia.txt · Dernière modification: 21/12/2025/H09:55:42 (modification externe)