MiniMax M3 출시: MSA 아키텍처로 1M 초장기 컨텍스트 구현, 코딩 및 멀티모달 능력 국제 최전선 진입

ref · 6월 1, 2026, 3:00오전

미니맥스(MiniMax)가 6월 1일 플래그십 대형 모델 M3를 공식 출시했습니다. M3는 자체 개발한 완전히 새로운 희소 어텐션 아키텍처 MSA(MiniMax Sparse Attention)를 채택하여 최대 100만 토큰의 초장기 컨텍스트를 지원하며, 이 규모에서 토큰당 계산량은 이전 세대 모델의 1/20에 불과하고, 프리필링 단계 속도는 9배 이상, 디코딩 단계 속도는 15배 이상 향상되었습니다. 프로그래밍 능력 측면에서 M3의 SWE-Bench Pro 점수는 59.0%로, GPT-5.5와 Gemini 3.1 Pro를 능가하고 Claude Opus 4.7에 근접하며, 엔드투엔드 에이전트 평가인 Claw-Eval에서 1위, SVG-Bench에서 Opus 4.7을 능가했습니다. M3는 동시에 네이티브 멀티모달 모델로, 이미지와 비디오 입력을 지원하며 컴퓨터 데스크톱 조작(Computer Use) 기능을 갖추고 있습니다. 미니맥스는 M3가 국내 최초로 최첨단 코딩(Coding)/에이전트(Agentic) 능력, 100만(1M) 초장기 컨텍스트, 네이티브 멀티모달이라는 세 가지 요소를 동시에 갖춘 모델이자, 현재 위 조건을 모두 충족하는 유일한 오픈소스 모델이라고 밝혔습니다.

미니맥스는 세 가지 장기 자율 능력 사례를 공개했습니다. M3가 ICLR 2025 최우수 논문 한 편을 독립적으로 재현했으며, 약 12시간 동안 자율적으로 실행하여 18개의 커밋과 23개의 실험 차트를 생성했습니다. 또한 NVIDIA Hopper 아키텍처 GPU에서 FP8 행렬 곱셈 연산자를 최적화하여 147번의 벤치마크 제출과 약 24시간의 연속 실행을 통해 하드웨어 최대 활용률을 7.6%에서 71.3%로 끌어올려 9.4배의 가속을 달성했습니다. PostTrainBench에서는 데이터 합성→훈련→평가의 전체 프로세스를 자율적으로 완료하여 0.37점을 기록, GPT-5.5(0.39)와 Opus 4.7(0.42)에 근접했습니다. M3와 동시에 출시된 에이전트 제품인 MiniMax Code는 에이전트 팀(Agent Team)의 동시 협업과 Computer Use를 지원합니다. 토큰 플랜(Token Plan)은 세 가지 등급으로 나뉩니다: Plus 49위안/월(6억 토큰), Max 119위안/월(18억 토큰), Ultra 469위안/월(55억 토큰). API는 현재 공개되었으며, 회사는 향후 10일 이내에 기술 보고서를 발표하고 모델 가중치를 오픈소스로 공개할 계획입니다.

MiniMax 공식 블로그

글	댓글	조회수
中国 AI 独角兽 MiniMax 年化营收翻番至逾 3 亿美元，下一代旗舰模型 M3 蓄势待发常规 ai , 大模型 , minimax , 营收	1	5월 29, 2026
Alibaba releases Qwen3.7-Plus, flagship vision-capable multimodal model, lifts Alibaba to #5 globally in Vision Arena 常规 ai , llm , qwen , alibaba	1	6월 2, 2026
深圳联合华为昇腾910C集群完成 1.6 万亿参数 DeepSeek-V4-Pro 全参数后训练，国产算力突破训练瓶颈常规 deepseek , 华为	2	6월 5, 2026
Google DeepMind 推出 Gemma 4 12B，16 GB 内存笔记本可本地运行常规 ai , google , gemma	1	6월 4, 2026
Anthropic 发布 Claude Opus 4.8：智能体编码成绩升至 69.2%，新增思考强度控制与动态工作流常规 anthropic , claude , ai , 大模型 , 智能体	1	5월 29, 2026

MiniMax M3 출시: MSA 아키텍처로 1M 초장기 컨텍스트 구현, 코딩 및 멀티모달 능력 국제 최전선 진입

Related topics