MiniMax M3 dévoilé : l'architecture MSA permet un contexte ultra-long de 1M, le codage et les capacités multimodales atteignent un niveau international de pointe

ref · Juin 1, 2026, 3:00

MiniMax a officiellement lancé son modèle phare M3 le 1er juin. Le M3 utilise l’architecture d’attention parcimonieuse propriétaire MSA (MiniMax Sparse Attention), prenant en charge jusqu’à 1 million de tokens de contexte ultra-long, avec un calcul par token seulement 1/20e de celui du modèle précédent à cette échelle. La phase de pré-remplissage est accélérée de plus de 9 fois et la phase de décodage de plus de 15 fois. En termes de capacités de programmation, le M3 obtient un score de 59,0 % sur SWE-Bench Pro, dépassant GPT-5.5 et Gemini 3.1 Pro, et se rapprochant de Claude Opus 4.7. Il se classe premier sur l’évaluation de bout en bout des agents Claw-Eval et dépasse Opus 4.7 sur SVG-Bench. Le M3 est également un modèle natif multimodal, prenant en charge les entrées d’images et de vidéos, et possède la capacité d’opérer sur le bureau d’un ordinateur (Computer Use). MiniMax affirme que le M3 est le premier modèle en Chine à posséder simultanément des capacités avancées de codage et d’agent, un contexte ultra-long de 1M et une multimodalité native, et c’est aussi le seul modèle open source à remplir actuellement toutes ces conditions.

MiniMax a divulgué trois cas de capacités autonomes à longue portée : le M3 a reproduit de manière indépendante un meilleur article d’ICLR 2025, fonctionnant de manière autonome pendant environ 12 heures, produisant 18 commits et 23 graphiques expérimentaux ; il a optimisé un opérateur de multiplication matricielle FP8 sur un GPU d’architecture Hopper de NVIDIA, après 147 soumissions de benchmark et environ 24 heures d’exécution continue, passant l’utilisation maximale du matériel de 7,6 % à 71,3 %, réalisant une accélération de 9,4 fois ; sur PostTrainBench, il a achevé de manière autonome le pipeline complet de synthèse des données → entraînement → évaluation, obtenant un score de 0,37, proche de GPT-5.5 (0,39) et Opus 4.7 (0,42). Le produit Agent MiniMax Code, publié conjointement avec le M3, prend en charge la collaboration concurrente d’équipes d’agents et Computer Use. La formule Token Plan est divisée en trois niveaux : Plus 49 ¥/mois (600 millions de tokens), Max 119 ¥/mois (1,8 milliard de tokens), Ultra 469 ¥/mois (5,5 milliards de tokens) ; l’API est désormais ouverte, et la société prévoit de publier un rapport technique et les poids du modèle open source dans les 10 prochains jours.

MiniMax官方博客

Sujet	Réponses	Vues
中国 AI 独角兽 MiniMax 年化营收翻番至逾 3 亿美元，下一代旗舰模型 M3 蓄势待发常规 ai , 大模型 , minimax , 营收	1	Mai 29, 2026
Alibaba releases Qwen3.7-Plus, flagship vision-capable multimodal model, lifts Alibaba to #5 globally in Vision Arena 常规 ai , llm , qwen , alibaba	1	Juin 2, 2026
深圳联合华为昇腾910C集群完成 1.6 万亿参数 DeepSeek-V4-Pro 全参数后训练，国产算力突破训练瓶颈常规 deepseek , 华为	2	Juin 5, 2026
Google DeepMind 推出 Gemma 4 12B，16 GB 内存笔记本可本地运行常规 ai , google , gemma	1	Juin 4, 2026
Anthropic 发布 Claude Opus 4.8：智能体编码成绩升至 69.2%，新增思考强度控制与动态工作流常规 anthropic , claude , ai , 大模型 , 智能体	1	Mai 29, 2026

MiniMax M3 dévoilé : l'architecture MSA permet un contexte ultra-long de 1M, le codage et les capacités multimodales atteignent un niveau international de pointe

Sujets connexes