25/12/2025/H15:55:43
L'IA de Google surpasse pour la première fois les mathématiciens humains
Si Google dit vrai, DeepMind, sa branche dédiée à l'intelligence artificielle (IA), pourrait bien être à l'origine de la toute première découverte scientifique effectuée par un robot conversationnel.
L'entreprise, qui s'était déjà fait remarquer avec son programme de jeu de go AlphaGo ou ses prévisions météo générées par IA, a partagé les résultats de son nouvel outil: un chatbot conçu pour se livrer à la résolution de problèmes mathématiques, comme l'explique New Scientist.
Abonnez-vous gratuitement à la newsletter quotidienne de korii. et ne ratez aucun article.
Je m'abonne Alhussein Fawzi, chercheur à Google DeepMind, et ses collègues ont créé un grand modèle de langage (LLM) appelé FunSearch, basé sur le chatbot de Google PaLM2, auquel ils ont rajouté une couche supplémentaire: un «fact checker» vérifiant les réponses proposées pour faire le tri et ne garder que les plus plausibles.
Cet «évaluateur» permet de limiter les «hallucinations» propres aux chatbots qui semblent parfois incapables de donner la bonne réponse à des questions simples, comme «Qui a remporté l'Oscar du meilleur acteur cette année?». L'IA peut toujours se tromper, mais le filtre supplémentaire ne conserve que les concepts fiables.
Repenser la collaboration homme-machine«Nous pensons que peut-être 90% de ce que le grand modèle de langage produit ne sera pas utile, déclare Alhussein Fawzi. Si vous me proposez une solution, il est très facile pour moi de vous dire si elle est correcte et de l'évaluer. Mais c'est trouver une solution qui est vraiment difficile.»
L'équipe de Google DeepMind affirme désormais que son modèle peut générer de nouvelles connaissances et trouver seul de nouvelles idées scientifiques, ce qui serait une première pour l'IA.
Concrètement, les chercheurs ont proposé à FunSearch un problème et une solution basique. Ils lui ont ensuite demandé de proposer de nouvelles solutions à ce problème, dont la précision a été vérifiée par l'évaluateur. Les meilleures réponses lui sont ensuite de nouveau proposées, avec cette fois la consigne de les améliorer.
Google DeepMind affirme que FunSearch produit des millions de solutions potentielles, qui convergent toutes, après plusieurs passages, vers un résultat dépassant parfois la meilleure solution connue. Paresseux, le modèle de langage est même capable d'écrire des programmes informatiques qui trouveront les solutions à sa place.
Dans la revue Nature, le mathématicien Jordan Ellenberg (qui a collaboré avec l'entreprise sur le projet) résume cette avancée technologique ainsi: «Le plus excitant dans tout ça, c'est de développer des nouveaux modes de collaboration entre l'homme et la machine. FunSearch ne remplacera pas les mathématiciens humains, mais pourrait être utilisé comme un multiplicateur de force.»
https://korii.slate.fr/tech/ia-google-surpasse-premiere-fois-mathematiciens-humains-deepmind
you see this when javscript or css is not working correct