MiniMax M3 출시: MSA 아키텍처로 1M 초장기 컨텍스트 구현, 코딩 및 멀티모달 능력 국제 최전선 진입

미니맥스(MiniMax)가 6월 1일 플래그십 대형 모델 M3를 공식 출시했습니다. M3는 자체 개발한 완전히 새로운 희소 어텐션 아키텍처 MSA(MiniMax Sparse Attention)를 채택하여 최대 100만 토큰의 초장기 컨텍스트를 지원하며, 이 규모에서 토큰당 계산량은 이전 세대 모델의 1/20에 불과하고, 프리필링 단계 속도는 9배 이상, 디코딩 단계 속도는 15배 이상 향상되었습니다. 프로그래밍 능력 측면에서 M3의 SWE-Bench Pro 점수는 59.0%로, GPT-5.5와 Gemini 3.1 Pro를 능가하고 Claude Opus 4.7에 근접하며, 엔드투엔드 에이전트 평가인 Claw-Eval에서 1위, SVG-Bench에서 Opus 4.7을 능가했습니다. M3는 동시에 네이티브 멀티모달 모델로, 이미지와 비디오 입력을 지원하며 컴퓨터 데스크톱 조작(Computer Use) 기능을 갖추고 있습니다. 미니맥스는 M3가 국내 최초로 최첨단 코딩(Coding)/에이전트(Agentic) 능력, 100만(1M) 초장기 컨텍스트, 네이티브 멀티모달이라는 세 가지 요소를 동시에 갖춘 모델이자, 현재 위 조건을 모두 충족하는 유일한 오픈소스 모델이라고 밝혔습니다.

미니맥스는 세 가지 장기 자율 능력 사례를 공개했습니다. M3가 ICLR 2025 최우수 논문 한 편을 독립적으로 재현했으며, 약 12시간 동안 자율적으로 실행하여 18개의 커밋과 23개의 실험 차트를 생성했습니다. 또한 NVIDIA Hopper 아키텍처 GPU에서 FP8 행렬 곱셈 연산자를 최적화하여 147번의 벤치마크 제출과 약 24시간의 연속 실행을 통해 하드웨어 최대 활용률을 7.6%에서 71.3%로 끌어올려 9.4배의 가속을 달성했습니다. PostTrainBench에서는 데이터 합성→훈련→평가의 전체 프로세스를 자율적으로 완료하여 0.37점을 기록, GPT-5.5(0.39)와 Opus 4.7(0.42)에 근접했습니다. M3와 동시에 출시된 에이전트 제품인 MiniMax Code는 에이전트 팀(Agent Team)의 동시 협업과 Computer Use를 지원합니다. 토큰 플랜(Token Plan)은 세 가지 등급으로 나뉩니다: Plus 49위안/월(6억 토큰), Max 119위안/월(18억 토큰), Ultra 469위안/월(55억 토큰). API는 현재 공개되었으며, 회사는 향후 10일 이내에 기술 보고서를 발표하고 모델 가중치를 오픈소스로 공개할 계획입니다.

MiniMax 공식 블로그