Utilisateur non connecté
Le site de Korben: HRM - L'IA qui ridiculise ChatGPT avec seulement 27 millions de paramètres [ElseNews]

Outils pour utilisateurs

Outils du site


elsenews:spot-2025:07:hrm-ia

Le site de Korben: HRM - L'IA qui ridiculise ChatGPT avec seulement 27 millions de paramètres

https://korben.info/hrm-ridiculise-chatgpt-seulement-millions-parametres.html

Le site de Korben
Suivez-moi en direct sur Twitch 🎮📺
Rejoignez ma communauté Twitch !
Image illustrant l'article : HRM - L'IA qui ridiculise ChatGPT avec seulement 27 millions de paramètres
HRM - L'IA qui ridiculise ChatGPT avec seulement 27 millions de paramètres
Le 28 juillet 2025
par Korben ✨ -
DeveloppementIntelligence-Artificielle
Ce lundi matin, pendant que vous buvez votre café tiède en écoutant vos collègues évoquer leur future retraite imaginaire, sachez que des chercheurs singapouriens vient encore de repousser les frontières de l’IA avec HRM, un modèle qui résout des Sudoku impossibles sans même transpirer. Et il ne pèse que 27 Mo.

Je vous explique… La startup Sapient Intelligence vient de sortir le Hierarchical Reasoning Model (HRM), et c’est un véritable game-changer car avec seulement 27 millions de paramètres (c’est 6500 fois moins que GPT-3) cette petite bête arrive à battre les géants de l’IA sur des tâches de raisonnement complexe. Et le plus fort c’est qu’elle n’a besoin que de 1000 exemples pour apprendre, là où les autres en demandent des millions.

Le secret de cette prouesse, c’est une architecture directement inspirée de notre cerveau. Au lieu de faire comme les LLMs classiques qui génèrent du texte token par token en mode “je réfléchis à voix haute”, HRM fonctionne avec deux modules qui bossent ensemble : un module H (High-level) qui fait la planification stratégique lente, et un module L (Low-level) pour les calculs rapides et détaillés. En gros c’est un architecte qui dessine les plans et un maçon qui construit.

Et alors ça donne quoi dans la réalité ? Et bien sur des Sudoku niveau “extreme” où GPT-4 et Claude se cassent les dents avec un score de 0%, HRM affiche tranquillement un taux de réussite quasi parfait. Sur le benchmark ARC-AGI qui teste le raisonnement abstrait, il tape des scores de 40.3% contre 34.5% pour o3-mini d’OpenAI et 21.2% pour Claude 3.7 Sonnet. Pas mal donc pour un modèle qui tient sur une clé USB.

Mais le vrai kiff, c’est la vitesse d’exécution. Guan Wang, le CEO de Sapient Intelligence, parle d’un gain de performance de x100 par rapport aux approches chain-of-thought classiques. Pourquoi ? Et bien parce qu’au lieu de générer des pavés de texte pour expliquer chaque étape de raisonnement, HRM fait tout ça en interne, dans son “espace latent”. C’est ça la différence entre quelqu’un qui marmonne tout ce qu’il pense (le fou de la gare) et quelqu’un qui réfléchit dans sa tête avant de donner la réponse.

D’ailleurs, cette histoire de chain-of-thought, c’est un peu la “béquille” des LLMs actuels. Les chercheurs de Sapient ne mâchent pas leurs mots dans leur papier : en disant que “C’est une béquille, pas une solution satisfaisante. Ça repose sur des décompositions fragiles définies par l’humain où une seule erreur peut faire dérailler tout le processus de raisonnement.” Ouille…

Pour l’entraînement, c’est du grand art aussi. Il faut seulement 2 heures de GPU pour apprendre à résoudre des Sudoku niveau pro, et entre 50 et 200 heures pour le benchmark ARC-AGI. Comparez ça aux milliers d’heures nécessaires pour entraîner GPT-4, et vous comprenez pourquoi les entreprises commencent à s’intéresser sérieusement à cette approche.

L’équipe derrière ça sont des anciens de Google DeepMind, DeepSeek, Anthropic et xAI, accompagnés d’académiques de grandes universités. Ils ont même mis le code en open source sur GitHub, donc si vous voulez jouer avec, c’est cadeau.

Pour les applications concrètes, Wang voit grand : santé pour les diagnostics complexes, prévisions climatiques (ils annoncent 97% de précision sur les prévisions saisonnières), et robotique comme “cerveau décisionnel” embarqué. Parce que oui, avec sa taille réduite et sa faible consommation, HRM peut tourner sur des appareils edge sans problème.

Alors bien sûr, ne jetez pas ChatGPT ou Claude à la poubelle tout de suite car pour les tâches créatives et linguistiques, les LLMs restent imbattables. Mais pour tout ce qui demande du raisonnement pur et dur, c’est à dire optimisation logistique, diagnostic de systèmes complexes, planification…etc, HRM pourrait bien devenir le nouveau standard.

Ainsi, depuis des années, la course à l’IA c’était “qui aura le plus gros modèle” et là, Sapient nous montre qu’avec une architecture intelligente inspirée du cerveau, on peut faire mieux avec infiniment moins. Si vous suivez l’actualité des nouveaux modèles IA comme Llama 4, vous savez que l’industrie commence à explorer des architectures alternatives comme par exemple les Mixture of Experts pour optimiser les performances, donc peut-être que Meta ou d’autres intégreront HRM dans le futur à leurs nouveaux modèles.

Voilà, en attendant la prochaine révolution hebdomadaire de l’IA (Perso, je me régale !! Pas vous ??), vous pouvez déjà aller tester le code sur leur GitHub. Et qui sait, peut-être que dans quelques années, on se souviendra de ce moment comme du jour où l’IA a commencé à vraiment penser comme nous. Enfin, en mieux et en plus vite.

Source

La clé de la réussite pour votre TPE/PME : les nouvelles offres o2switch
Contenu partenaire
Vous cherchez un hébergement web professionnel pour propulser votre entreprise ? Ne cherchez plus.

Illustration représentant l'offre d'hébergement o2switch pour les TPE/PME
Avec les nouvelles offres de o2switch, offrez à votre TPE/PME l'hébergement qu'elle mérite pour viser les sommets.

Choisissez l'offre qui vous convient : Cloud avec 12 CPU et 48 Go de RAM à 1,76 € HT/mois, ou Pro avec 24 CPU et 64 Go de RAM à 3,84 € HT/mois la première année. Stockez sans compter grâce à l'espace disque illimité en NVMe. Soyez serein avec des sauvegardes jusqu'à 90 jours et un support ultra prioritaire 24/7.

Pilotez votre activité en ligne du bout des doigts, sans connaissances techniques, via l'interface cPanel. Site web, outils, emails… tout est centralisé !

Le meilleur dans tout ça ? Les offres démarrent à seulement 1,76 € HT/mois avec le code FAST25. C'est le moment d'offrir à votre entreprise l'hébergement qu'elle mérite pour décoller. Avec o2switch, dites adieu aux problèmes techniques et bonjour à la croissance !

Découvrez les nouvelles offres o2switch

Photo de Korben
Korben
Bienvenue sur mon site ! Ici je bidouille, teste & casse des trucs et décortique l'actu tech depuis 20 ans. Alors si ça vous plait, rejoignez l'aventure !

Devenir Patreon →
Soutenez-nous sur Twitch
Mes slashes
🍉
/now - Mon actu
📟
/uses - Mon setup
Articles Récents
Image illustrant l'article : Octelium - La plateforme Zero Trust open source pour vos accès distantsOctelium - La plateforme Zero Trust open …
Image illustrant l'article : Google AI Overviews - Comment l'IA tue le web et notre cerveauGoogle AI Overviews - Comment l'IA tue …
Image illustrant l'article : Plakar - La solution de backup open source française qui décoiffePlakar - La solution de backup open …
Image illustrant l'article : Deskflow - Pour partager votre souris et clavier entre plusieurs PCDeskflow - Pour partager votre souris et …
Image illustrant l'article : Microsoft lance une formation gratuite de 10h pour maîtriser GitHub Copilot et son mode agentMicrosoft lance une formation gratuite …
Image illustrant l'article : Des chercheurs crackent la sécurité des eSIM - 2 milliards de puces vulnérables au clonageDes chercheurs crackent la sécurité des …
Suivez le chef!
Patreon
Twitter
Instagram
TikTok
Youtube
Newsletter
Flux RSS
Twitch
Bannière présentant divers métiers de la cybersécurité
Illustration représentant un ingénieur en cybersécurité au travailIngénieur cybersécurité
Représentation visuelle du travail d'un cryptologue avec des symboles de chiffrementCryptologue
Image symbolisant le travail d'un pentester testant la sécurité d'un systèmePentester
Représentation d'un hacker éthique travaillant sur la sécurité informatiqueHacker éthique
Illustration d'un consultant en cybersécurité en train de conseiller un clientConsultant cybersécurité
Rejoignez la communauté
Rejoignez la communauté
Sur Patreon
Patreon
Twitter
Instagram
TikTok
Youtube
Newsletter
Flux RSS
Twitch
Illustration décorative bébé Korben
Le site de Korben, média indépendant soutenu par ses Patreons

Icône menu hamburger
Icône changement de police
Icône changement de thème
Icône recherche
2004 - 2025 Le site de Korben - Le site de Korben, marque déposée. Tous droits réservés. Auteurs, mentions légales, contact et maintenant.

× iphelper toolbox

you see this when javscript or css is not working correct

Untested
IP Address:
First usable:
Subnet:
Last usable:
CIDR:
Amount of usable:
Network address:
Reverse address:
Broadcast address:

elsenews/spot-2025/07/hrm-ia.txt · Dernière modification: 28/07/2025/H22:14:44 (modification externe)