25/12/2025/H21:12:35
Mistral AI accélère la cadence. La start-up française la plus en vue dans le domaine de l'IA veut faire ses preuves. Et pour y parvenir, elle n'hésite pas à mettre le paquet sur le développement de ses modèles. Preuve en est avec son dernier modèle tout juste publié : Pixtral Large. Dans le détail, il s'agit d'un modèle multimodal à pondération ouverte de 124 milliards de paramètres (rien que ça) construit sur la base de Mistral Large 2.
Second modèle de la famille de modèles multimodaux, il démontre une compréhension d'images de “niveau frontier”, affirme la start-up, insistant sur sa capacité à comprendre des documents, des graphiques et des images naturelles, tout en conservant la compréhension de texte de pointe de Mistral Large 2. Il possède par ailleurs une fenêtre de contexte de 128 000 jetons et peut contenir au moins 30 images haute résolution.
Mistral se mesure à Anthropic, Google et OpenAI
Côté performances, Pixtral Large bat des records. Evalué par rapport aux modèles de type frontier sur un ensemble de benchmarks multimodaux standard, il se révèle meilleur que les modèles publiés par les concurrents directs de Mistral. Ainsi, sur MathVista, qui évalue le raisonnement mathématique complexe sur des données visuelles, le modèle atteint un score de 69,4%, surpassant tous les autres modèles. Par comparaison, Llama-3.2 90B atteint 49,1%, Gemini-1.5 Pro 67,8%, GPT-4o 65,4% et Claude-3.5 Sonnet 67,1%.
Pour évaluer les capacités de raisonnement sur des graphiques et des documents complexes, les équipes de Mistral se sont appuyées sur les tests ChartQA et DocVQA, où Pixtral Large surpasse également GPT-4o et Gemini-1.5 Pro.
Enfin, Pixtral Large démontre des capacités compétitives sur le test open source MM-MT-Bench destiné à refléter les cas d'utilisation réels des LLM multimodaux. Il surpasse Claude-3.5 Sonnet, Gemini-1.5 Pro et GPT-4o (le plus récent). Le modèle est disponible sous la licence de recherche Mistral (MRL) pour la recherche et l'utilisation éducative, précise la start-up, ajoutant qu'il est également disponible sous licence commerciale Mistral pour l'expérimentation, les tests et la production à des fins commerciales.
Mistral Large mis à jour
En plus de Pixtral Large, Mistral Large, son modèle multilingue publié en février dernier, profite d'une mise à jour. Dédié au raisonnement de haut niveau pour les tâches complexes, il est désormais disponible sur pixtral-large-latest, l'API de la start-up, et sous le nom de Mistral Large 24.11 sur Hugging Face sous la licence Mistral Research pour la recherche, ou avec une licence commerciale de Mistral AI pour une utilisation commerciale.
Par comparaison avec Large 24.07, cette version profite d'améliorations dans la compréhension du contexte long, l'ajout d'une invite système et un appel de fonction plus précis. “Le modèle est très performant pour les flux de travail RAG et agentiques, ce qui en fait un choix approprié pour les cas d'utilisation en entreprise tels que l'exploration et le partage des connaissances, la compréhension sémantique des documents, l'automatisation des tâches et l'amélioration de l'expérience client”, commente la start-up. Le modèle devrait rapidement être disponible sur les plateformes des fournisseurs, à commencer par Google Cloud et Microsoft Azure d'ici une semaine.
L'interface “Le Chat” capable de rivaliser avec ChatGPT
Mistral aime faire des entrées remarquées. Et la dernière version de son interface conversationnelle “Le Chat” en est un bel exemple. Dans sa dernière mise à jour, l'interface bénéficie de nombreux ajouts qui vont faire pâlir OpenAI et son célèbre ChatGPT ou encore Google avec Gemini. Les dernières fonctionnalités incluent : la recherche sur le Web avec citations, canvas pour l'idéation, l'édition en ligne et l'exportation, l'intégration du dernier modèle Pixtral Large pour une meilleure compréhension des documents et des images, la génération d'images, propulsée par Black Forest Labs Flux Pro.
L'outil Canvas ressemble fortement à l'interface au nom éponyme lancé par OpenAI en début de mois. En clair, l'interface s'affiche dans la fenêtre de discussion lorsque l'utilisateur a besoin d'aller au-delà des conversations et d'entrer dans la création. Il est possible d'utiliser les différents modèles de Mistral sur des résultats partagés et modifier le contenu créé directement en ligne sans régénérer les réponses, créer des versions de brouillons et prévisualiser les conceptions.
Décidé à se démarquer, Mistral assure ne pas chercher à poursuivre “l'AGI à tout prix ; notre mission est plutôt de mettre l'IA de pointe entre vos mains”. Sur “Le Chat”, le fleuron français propose ainsi un niveau gratuit avec ces fonctionnalités bêta et travaille au développement de versions premium avec des garanties de service plus élevées.
https://www.usine-digitale.fr/article/mistral-ai-lache-une-bombe-du-nom-de-pixtral-large-capable-de-battre-gemini-1-5-pro-et-gpt-4o.N2222815
you see this when javscript or css is not working correct