Utilisateur non connecté
elsenews:spot-2025:07:hrm-ia [ElseNews]

Outils pour utilisateurs

Outils du site


elsenews:spot-2025:07:hrm-ia

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Prochaine révision
Révision précédente
elsenews:spot-2025:07:hrm-ia [28/07/2025/H22:14:44]
127.0.0.1 modification externe
— (Version actuelle)
Ligne 1: Ligne 1:
- {{tag>a1}} 
-  
  
- 
----- 
-====== Le site de Korben: HRM - L'IA qui ridiculise ChatGPT avec seulement 27 millions de paramètres ====== 
- https://korben.info/hrm-ridiculise-chatgpt-seulement-millions-parametres.html  
- 
- 
-Le site de Korben 
-Suivez-moi en direct sur Twitch 🎮📺 
-Rejoignez ma communauté Twitch ! 
-Image illustrant l'article : HRM - L'IA qui ridiculise ChatGPT avec seulement 27 millions de paramètres 
-HRM - L'IA qui ridiculise ChatGPT avec seulement 27 millions de paramètres 
-Le 28 juillet 2025 
-par Korben ✨ - 
-DeveloppementIntelligence-Artificielle 
-Ce lundi matin, pendant que vous buvez votre café tiède en écoutant vos collègues évoquer leur future retraite imaginaire, sachez que des chercheurs singapouriens vient encore de repousser les frontières de l’IA avec HRM, un modèle qui résout des Sudoku impossibles sans même transpirer. Et il ne pèse que 27 Mo. 
- 
-Je vous explique… La startup Sapient Intelligence vient de sortir le Hierarchical Reasoning Model (HRM), et c’est un véritable game-changer car avec seulement 27 millions de paramètres (c’est 6500 fois moins que GPT-3) cette petite bête arrive à battre les géants de l’IA sur des tâches de raisonnement complexe. Et le plus fort c’est qu’elle n’a besoin que de 1000 exemples pour apprendre, là où les autres en demandent des millions. 
- 
-Le secret de cette prouesse, c’est une architecture directement inspirée de notre cerveau. Au lieu de faire comme les LLMs classiques qui génèrent du texte token par token en mode “je réfléchis à voix haute”, HRM fonctionne avec deux modules qui bossent ensemble : un module H (High-level) qui fait la planification stratégique lente, et un module L (Low-level) pour les calculs rapides et détaillés. En gros c’est un architecte qui dessine les plans et un maçon qui construit. 
- 
-Et alors ça donne quoi dans la réalité ? Et bien sur des Sudoku niveau “extreme” où GPT-4 et Claude se cassent les dents avec un score de 0%, HRM affiche tranquillement un taux de réussite quasi parfait. Sur le benchmark ARC-AGI qui teste le raisonnement abstrait, il tape des scores de 40.3% contre 34.5% pour o3-mini d’OpenAI et 21.2% pour Claude 3.7 Sonnet. Pas mal donc pour un modèle qui tient sur une clé USB. 
- 
-Mais le vrai kiff, c’est la vitesse d’exécution. Guan Wang, le CEO de Sapient Intelligence, parle d’un gain de performance de x100 par rapport aux approches chain-of-thought classiques. Pourquoi ? Et bien parce qu’au lieu de générer des pavés de texte pour expliquer chaque étape de raisonnement, HRM fait tout ça en interne, dans son “espace latent”. C’est ça la différence entre quelqu’un qui marmonne tout ce qu’il pense (le fou de la gare) et quelqu’un qui réfléchit dans sa tête avant de donner la réponse. 
- 
-D’ailleurs, cette histoire de chain-of-thought, c’est un peu la “béquille” des LLMs actuels. Les chercheurs de Sapient ne mâchent pas leurs mots dans leur papier : en disant que “C’est une béquille, pas une solution satisfaisante. Ça repose sur des décompositions fragiles définies par l’humain où une seule erreur peut faire dérailler tout le processus de raisonnement.” Ouille… 
- 
-Pour l’entraînement, c’est du grand art aussi. Il faut seulement 2 heures de GPU pour apprendre à résoudre des Sudoku niveau pro, et entre 50 et 200 heures pour le benchmark ARC-AGI. Comparez ça aux milliers d’heures nécessaires pour entraîner GPT-4, et vous comprenez pourquoi les entreprises commencent à s’intéresser sérieusement à cette approche. 
- 
-L’équipe derrière ça sont des anciens de Google DeepMind, DeepSeek, Anthropic et xAI, accompagnés d’académiques de grandes universités. Ils ont même mis le code en open source sur GitHub, donc si vous voulez jouer avec, c’est cadeau. 
- 
-Pour les applications concrètes, Wang voit grand : santé pour les diagnostics complexes, prévisions climatiques (ils annoncent 97% de précision sur les prévisions saisonnières), et robotique comme “cerveau décisionnel” embarqué. Parce que oui, avec sa taille réduite et sa faible consommation, HRM peut tourner sur des appareils edge sans problème. 
- 
-Alors bien sûr, ne jetez pas ChatGPT ou Claude à la poubelle tout de suite car pour les tâches créatives et linguistiques, les LLMs restent imbattables. Mais pour tout ce qui demande du raisonnement pur et dur, c’est à dire optimisation logistique, diagnostic de systèmes complexes, planification…etc, HRM pourrait bien devenir le nouveau standard. 
- 
-Ainsi, depuis des années, la course à l’IA c’était “qui aura le plus gros modèle” et là, Sapient nous montre qu’avec une architecture intelligente inspirée du cerveau, on peut faire mieux avec infiniment moins. Si vous suivez l’actualité des nouveaux modèles IA comme Llama 4, vous savez que l’industrie commence à explorer des architectures alternatives comme par exemple les Mixture of Experts pour optimiser les performances, donc peut-être que Meta ou d’autres intégreront HRM dans le futur à leurs nouveaux modèles. 
- 
-Voilà, en attendant la prochaine révolution hebdomadaire de l’IA (Perso, je me régale !! Pas vous ??), vous pouvez déjà aller tester le code sur leur GitHub. Et qui sait, peut-être que dans quelques années, on se souviendra de ce moment comme du jour où l’IA a commencé à vraiment penser comme nous. Enfin, en mieux et en plus vite. 
- 
-Source 
- 
-La clé de la réussite pour votre TPE/PME : les nouvelles offres o2switch 
-Contenu partenaire 
-Vous cherchez un hébergement web professionnel pour propulser votre entreprise ? Ne cherchez plus. 
- 
-Illustration représentant l'offre d'hébergement o2switch pour les TPE/PME 
-Avec les nouvelles offres de o2switch, offrez à votre TPE/PME l'hébergement qu'elle mérite pour viser les sommets. 
- 
-Choisissez l'offre qui vous convient : Cloud avec 12 CPU et 48 Go de RAM à 1,76 € HT/mois, ou Pro avec 24 CPU et 64 Go de RAM à 3,84 € HT/mois la première année. Stockez sans compter grâce à l'espace disque illimité en NVMe. Soyez serein avec des sauvegardes jusqu'à 90 jours et un support ultra prioritaire 24/7. 
- 
-Pilotez votre activité en ligne du bout des doigts, sans connaissances techniques, via l'interface cPanel. Site web, outils, emails... tout est centralisé ! 
- 
-Le meilleur dans tout ça ? Les offres démarrent à seulement 1,76 € HT/mois avec le code FAST25. C'est le moment d'offrir à votre entreprise l'hébergement qu'elle mérite pour décoller. Avec o2switch, dites adieu aux problèmes techniques et bonjour à la croissance ! 
- 
-Découvrez les nouvelles offres o2switch 
- 
-Photo de Korben 
-Korben 
-Bienvenue sur mon site ! Ici je bidouille, teste & casse des trucs et décortique l'actu tech depuis 20 ans. Alors si ça vous plait, rejoignez l'aventure ! 
- 
-Devenir Patreon → 
-Soutenez-nous sur Twitch 
-Mes slashes 
-🍉 
-/now - Mon actu 
-📟 
-/uses - Mon setup 
-Articles Récents 
-Image illustrant l'article : Octelium - La plateforme Zero Trust open source pour vos accès distantsOctelium - La plateforme Zero Trust open … 
-Image illustrant l'article : Google AI Overviews - Comment l'IA tue le web et notre cerveauGoogle AI Overviews - Comment l'IA tue … 
-Image illustrant l'article : Plakar - La solution de backup open source française qui décoiffePlakar - La solution de backup open … 
-Image illustrant l'article : Deskflow - Pour partager votre souris et clavier entre plusieurs PCDeskflow - Pour partager votre souris et … 
-Image illustrant l'article : Microsoft lance une formation gratuite de 10h pour maîtriser GitHub Copilot et son mode agentMicrosoft lance une formation gratuite … 
-Image illustrant l'article : Des chercheurs crackent la sécurité des eSIM - 2 milliards de puces vulnérables au clonageDes chercheurs crackent la sécurité des … 
-Suivez le chef! 
-Patreon 
-Twitter 
-Instagram 
-TikTok 
-Youtube 
-Newsletter 
-Flux RSS 
-Twitch 
-Bannière présentant divers métiers de la cybersécurité 
-Illustration représentant un ingénieur en cybersécurité au travailIngénieur cybersécurité 
-Représentation visuelle du travail d'un cryptologue avec des symboles de chiffrementCryptologue 
-Image symbolisant le travail d'un pentester testant la sécurité d'un systèmePentester 
-Représentation d'un hacker éthique travaillant sur la sécurité informatiqueHacker éthique 
-Illustration d'un consultant en cybersécurité en train de conseiller un clientConsultant cybersécurité 
-Rejoignez la communauté 
-Rejoignez la communauté 
-Sur Patreon 
-Patreon 
-Twitter 
-Instagram 
-TikTok 
-Youtube 
-Newsletter 
-Flux RSS 
-Twitch 
-Illustration décorative bébé Korben 
-Le site de Korben, média indépendant soutenu par ses Patreons 
- 
-Icône menu hamburger 
-Icône changement de police 
-Icône changement de thème 
-Icône recherche 
-2004 - 2025 Le site de Korben - Le site de Korben, marque déposée. Tous droits réservés. Auteurs, mentions légales, contact et maintenant. 
× iphelper toolbox

you see this when javscript or css is not working correct

Untested
IP Address:
First usable:
Subnet:
Last usable:
CIDR:
Amount of usable:
Network address:
Reverse address:
Broadcast address:

elsenews/spot-2025/07/hrm-ia.1753733684.txt · Dernière modification: 28/07/2025/H22:14:44 de 127.0.0.1