MiniMax a officiellement lancé son modèle phare M3 le 1er juin. Le M3 utilise l’architecture d’attention parcimonieuse propriétaire MSA (MiniMax Sparse Attention), prenant en charge jusqu’à 1 million de tokens de contexte ultra-long, avec un calcul par token seulement 1/20e de celui du modèle précédent à cette échelle. La phase de pré-remplissage est accélérée de plus de 9 fois et la phase de décodage de plus de 15 fois. En termes de capacités de programmation, le M3 obtient un score de 59,0 % sur SWE-Bench Pro, dépassant GPT-5.5 et Gemini 3.1 Pro, et se rapprochant de Claude Opus 4.7. Il se classe premier sur l’évaluation de bout en bout des agents Claw-Eval et dépasse Opus 4.7 sur SVG-Bench. Le M3 est également un modèle natif multimodal, prenant en charge les entrées d’images et de vidéos, et possède la capacité d’opérer sur le bureau d’un ordinateur (Computer Use). MiniMax affirme que le M3 est le premier modèle en Chine à posséder simultanément des capacités avancées de codage et d’agent, un contexte ultra-long de 1M et une multimodalité native, et c’est aussi le seul modèle open source à remplir actuellement toutes ces conditions.
MiniMax a divulgué trois cas de capacités autonomes à longue portée : le M3 a reproduit de manière indépendante un meilleur article d’ICLR 2025, fonctionnant de manière autonome pendant environ 12 heures, produisant 18 commits et 23 graphiques expérimentaux ; il a optimisé un opérateur de multiplication matricielle FP8 sur un GPU d’architecture Hopper de NVIDIA, après 147 soumissions de benchmark et environ 24 heures d’exécution continue, passant l’utilisation maximale du matériel de 7,6 % à 71,3 %, réalisant une accélération de 9,4 fois ; sur PostTrainBench, il a achevé de manière autonome le pipeline complet de synthèse des données → entraînement → évaluation, obtenant un score de 0,37, proche de GPT-5.5 (0,39) et Opus 4.7 (0,42). Le produit Agent MiniMax Code, publié conjointement avec le M3, prend en charge la collaboration concurrente d’équipes d’agents et Computer Use. La formule Token Plan est divisée en trois niveaux : Plus 49 ¥/mois (600 millions de tokens), Max 119 ¥/mois (1,8 milliard de tokens), Ultra 469 ¥/mois (5,5 milliards de tokens) ; l’API est désormais ouverte, et la société prévoit de publier un rapport technique et les poids du modèle open source dans les 10 prochains jours.