미니맥스(MiniMax)가 6월 1일 플래그십 대형 모델 M3를 공식 출시했습니다. M3는 자체 개발한 완전히 새로운 희소 어텐션 아키텍처 MSA(MiniMax Sparse Attention)를 채택하여 최대 100만 토큰의 초장기 컨텍스트를 지원하며, 이 규모에서 토큰당 계산량은 이전 세대 모델의 1/20에 불과하고, 프리필링 단계 속도는 9배 이상, 디코딩 단계 속도는 15배 이상 향상되었습니다. 프로그래밍 능력 측면에서 M3의 SWE-Bench Pro 점수는 59.0%로, GPT-5.5와 Gemini 3.1 Pro를 능가하고 Claude Opus 4.7에 근접하며, 엔드투엔드 에이전트 평가인 Claw-Eval에서 1위, SVG-Bench에서 Opus 4.7을 능가했습니다. M3는 동시에 네이티브 멀티모달 모델로, 이미지와 비디오 입력을 지원하며 컴퓨터 데스크톱 조작(Computer Use) 기능을 갖추고 있습니다. 미니맥스는 M3가 국내 최초로 최첨단 코딩(Coding)/에이전트(Agentic) 능력, 100만(1M) 초장기 컨텍스트, 네이티브 멀티모달이라는 세 가지 요소를 동시에 갖춘 모델이자, 현재 위 조건을 모두 충족하는 유일한 오픈소스 모델이라고 밝혔습니다.
미니맥스는 세 가지 장기 자율 능력 사례를 공개했습니다. M3가 ICLR 2025 최우수 논문 한 편을 독립적으로 재현했으며, 약 12시간 동안 자율적으로 실행하여 18개의 커밋과 23개의 실험 차트를 생성했습니다. 또한 NVIDIA Hopper 아키텍처 GPU에서 FP8 행렬 곱셈 연산자를 최적화하여 147번의 벤치마크 제출과 약 24시간의 연속 실행을 통해 하드웨어 최대 활용률을 7.6%에서 71.3%로 끌어올려 9.4배의 가속을 달성했습니다. PostTrainBench에서는 데이터 합성→훈련→평가의 전체 프로세스를 자율적으로 완료하여 0.37점을 기록, GPT-5.5(0.39)와 Opus 4.7(0.42)에 근접했습니다. M3와 동시에 출시된 에이전트 제품인 MiniMax Code는 에이전트 팀(Agent Team)의 동시 협업과 Computer Use를 지원합니다. 토큰 플랜(Token Plan)은 세 가지 등급으로 나뉩니다: Plus 49위안/월(6억 토큰), Max 119위안/월(18억 토큰), Ultra 469위안/월(55억 토큰). API는 현재 공개되었으며, 회사는 향후 10일 이내에 기술 보고서를 발표하고 모델 가중치를 오픈소스로 공개할 계획입니다.