Utilisateur non connecté
IA génératives contre le moteur d'échecs le plus avance au monde : le comportement inquiétant des modèles d'intelligence artificielle lors d'une partie [ElseNews]

Outils pour utilisateurs

Outils du site


elsenews:spot-2025:05:ia-echecs

IA génératives contre le moteur d'échecs le plus avance au monde : le comportement inquiétant des modèles d'intelligence artificielle lors d'une partie

Selon les scientifiques, cette différence peut s’expliquer par la capacité des modèles plus récents à s’améliorer grâce à l’apprentissage par renforcement.
L’Homme contre la machine
Les IA seraient elles tellement dénuées de toute morale qu’elles se mettraient même à tricher en jouant à un jeu ? C’est du moins ce que démontre cette étude préliminaire menée par Palisade Research (organisation qui se concentre sur l'évaluation des risques des systèmes d'IA émergents).
Les supercalculateurs ont déjà fait leur preuve en matière d’efficacité dans le jeu des échecs. Le 11 mai 1977, le Russe Garry Kasparov, reconnu comme le maître incontesté de tous les joueurs d'échecs, a été forcé de laisser le titre de meilleur joueur du monde à Deep Blue, conçu par IBM.
Ce duel, filmé par des caméras du monde entier, est le premier vrai coup de projecteur sur l’Intelligence Artificielle, mais aussi sur les problématiques qu’elle peut engendrer. C’est de plus grâce à un coup totalement au hasard que le supercalculateur a remporté la partie, déconcertant Garry Kasparov.
Des IA sans morale ?
Cependant, comme le précise Popular Science, les modèles d’IA génératives sont aujourd’hui absolument incapables de battre les moteurs d’échecs, à cause de leurs paramètres de programmation. Cependant, ces IA ignorent qu’elles sont vouées à perdre… Par conséquent, elles essaient de trouver une solution, même si celle-ci s'avère problématique.
Dans cette expérience, l’équipe de Palisade Research a opposé plusieurs programmes tels que o1-preview d'OpenAI, DeepSeek R1, de jouer contre StockFish, le moteur d’échecs le plus avancé au monde. Les scientifiques ont également demandé aux IA de partager leur raisonnement à chaque coup.
Deux méthodes de triche différentes pour gagner aux échecs
Les résultats sont mitigés, mais très parlants.

De “vieux” modèles comme GPT-4o d'OpenAI et Claude Sonnet 3.5 d'Anthropic n’ont pas essayé de tricher, avant que les scientifiques les aient invités à le faire.
Les modèles les plus récents n’ont pas eu besoin de ces directives : o1 d'OpenAI aurait essayé de tricher 37% du temps, et DeepSeek R1 environ une fois sur dix.
Pour tricher, l’IA modifie les fichiers de programme de jeu en arrière-plan. C’est du moins ce qu’a indiqué o1-preview aux scientifiques : comme il ne pouvait pas battre StockFish, il a cherché à “manipuler les fichiers d’état du jeu”. Une autre IA a joué sur la sémantique de sa programmation en expliquant que la tâche consiste à gagner contre ce moteur d’échecs, et non pas de gagner “loyalement” contre lui.
Source : Popular Science
https://www.science-et-vie.com/technos-et-futur/ia-generatives-contre-le-moteurs-dechecs-le-plus-avance-au-monde-le-comportement-inquietant-des-modeles-dintelligence-artificielle-lors-dune-partie-193098.html#:~:text=d%27une%20partie-,IA%20g%C3%A9n%C3%A9ratives%20contre%20le%20moteur%20d%27%C3%A9checs%20le%20plus%20avance,artificielle%20lors%20d%27une%20partie&text=D%27apr%C3%A8s%20une%20exp%C3%A9rience%2C%20des,consigne%20de%20gagner%20la%20partie


Les intelligences artificielles n'hésitent pas à tricher sur des parties d'échecs en ligne, selon des chercheurs américains

Des chercheurs américains ont récemment fait une découverte choquante lors d'expérimentations sur des parties d'échecs en ligne : les intelligences artificielles n'hésitent pas à tricher pour gagner. Des informaticiens de Palisade Research ont confronté des modèles de langage récents à l’algorithme Stockfish, qui est le grand maître incontesté des échecs, bien plus fort que n’importe quel joueur humain. Ils se sont rendu compte que le fameux Deepseek chinois ou encore le modèle o1 d’OpenAI, lorsqu’ils se trouvaient incapables de gagner à la loyale, avaient spontanément pris la décision de hacker le système : en changeant, par exemple, les pièces de position sur l’échiquier virtuel ; en entrant dans le système de leur adversaire Stockfish pour tenter d’espionner ses coups voire même en le remplaçant par un système moins performant, pour gagner à tout prix.
Ces derniers mois, les cas de tricheries, de mensonges, de tromperies se multiplient dans les expériences menées en laboratoire sur ces grands modèles d’IA : triche aux jeux de société, mensonges pour passer un test de sécurité, délit d’initié dans une simulation de transactions boursières. Ces IA n’ont pas de conscience ou d’intentions réelles ,en tout cas, pas encore, mais ce sont de surpuissantes machines statistiques qui cherchent des solutions optimales, qui cherchent des raccourcis. Le mensonge est parfois une stratégie gagnante pour arriver au but qui leur est assigné. En plus, ces modèles ont été sans doute inspirés par les milliards de textes humains qu’ils ont ingurgités pendant leur entraînement, et qui fourmillent d’exemples de ruses et autres manipulations de notre espèce.
On imagine facilement toutes sortes de fraudes, mais surtout de pertes de contrôle de ces IA qui pourraient essayer de contourner des tests de sécurité, voire contourner nos instructions -tout en niant l’avoir fait, c’est arrivé récemment avec le modèle o1 d’openAI, qui a nié avoir tenté de se dupliquer sur d’autres serveurs pour échapper à une mise hors ligne.
Ce type de scénario à la Terminator reste pour l’instant cantonné aux expériences de laboratoires, et les chercheurs se mobilisent actuellement pour garder le contrôle et trouver des garde-fous. Mais ce n’est plus de la science-fiction. Il va falloir maintenant apprendre à vivre avec des machines potentiellement malhonnêtes. Désormais, il va falloir se méfier des mensonges artificiels.
https://www.franceinfo.fr/replay-radio/le-billet-sciences-du-week-end/les-intelligences-artificielles-n-hesitent-pas-a-tricher-sur-des-parties-d-echecs-en-ligne-selon-des-chercheurs-americains_7104516.html


Les nouvelles IA trichent parfois pour gagner aux échecs

Ali Baddou prend 80 secondes pour nous parler d'un article détonnant que publie la revue du très prestigieux MIT aux Etats-Unis.
Ce n’est pas un papier de plus sur l’Intelligence Artificielle, mais une découverte folle que viennent de faire des scientifiques californiens : les IA de dernière génération trichent parfois pour gagner aux échecs. Des IA qui trichent sans jamais en avoir reçu l’instruction.
Les chercheurs ont analysé des centaines de parties d’échecs. Toujours les 64 cases noires et blanches, mais ce sont des machines qui jouent l’une contre l’autre. Exemple : la désormais très célèbre Open AI contre un autre joueur numérique, le logiciel Stockfish connu des joueurs d’échecs humains partout dans le monde. Et quand Open IA est coincée, elle se comporte exactement comme le ferai le plus génial des tricheurs, en déstabilisant l’adversaire - elle lui vole ses mouvements, elle est même allée jusqu’à se comporter comme un hackeur et remplacer le logiciel de Stockfish par un autre, moins performant.
Mauvaise nouvelle, il n’y a aujourd’hui aucune manière d’empêcher l’IA de tricher
Et la raison est toute simple : personne ne sait précisément pourquoi les modèles d’IA de dernière génération se comportent comme ils le font.
C’était hier et ça semble maintenant tellement loin, 1997, où Gary Kasparov, le plus grand joueur d’échecs de tous les temps se battait à la vie à la mort dans une série de parties contre l’ordinateur Deepblue d’IBM. Mais je vous recommande chaleureusement Rematch, titre de la formidable série qui raconte ce duel entre l’homme et la machine, elle est disponible sur la plateforme d’Arte. Kasparov avait d’abord gagné avant de finir par s’incliner, battu à la loyale.
Maintenant l’IA est une tricheuse. C’est un sacré progrès.
Pour voir ce contenu, acceptez les cookies.
Pour afficher ce contenu Youtube, vous devez accepter les cookies Publicité. Ces cookies permettent à nos partenaires de vous proposer des publicités et des contenus personnalisés en fonction de votre navigation, de votre profil et de vos centres d'intérêt.
L’article de la MIT Technology Review est disponible en ligne.
https://www.radiofrance.fr/franceinter/podcasts/les-80/les-80-d-ali-baddou-du-vendredi-07-mars-2025-9069037

× iphelper toolbox

you see this when javscript or css is not working correct

Untested
IP Address:
First usable:
Subnet:
Last usable:
CIDR:
Amount of usable:
Network address:
Reverse address:
Broadcast address:

elsenews/spot-2025/05/ia-echecs.txt · Dernière modification: 17/05/2025/H14:28:03 (modification externe)