Anthropic, Claude Opus 4.8 출시: 에이전트 코딩 성적 69.2%로 상승, 사고 강도 제어 및 동적 워크플로 추가

5월 29일(베이징 시간), Anthropic이 공식적으로 Claude Opus 4.8을 출시했습니다. 이전 세대 Opus 4.7 출시 이후 불과 41일 만으로, 이 회사 플래그십 모델의 최단 업데이트 주기를 기록했습니다. Anthropic 공식 발표에 따르면, 새 모델은 에이전트 코딩(SWE-Bench Pro) 점수가 64.3%에서 69.2%로, 다학제 추론 성적이 54.7%에서 57.9%로 상승했으며, 브라우저 에이전트 테스트 Online-Mind2Web에서 84%의 성적으로 GPT-5.5 및 Gemini 3.1 Pro를 능가했습니다. 표준 가격은 입력 토큰 100만 개당 5달러, 출력 25달러로 유지됩니다. 이번 업데이트에서 Anthropic은 "정직성"을 가장 두드러진 개선 사항 중 하나로 꼽았습니다. 내부 평가에 따르면, Opus 4.8은 코드 생성 시 결함을 발견하고도 알리지 않을 확률이 Opus 4.7의 약 4분의 1에 불과합니다.

이번 업데이트와 함께 두 가지 새로운 기능이 도입되었습니다. 첫째는 “사고 투입 제어”(Effort Control)로, 사용자가 claude.ai 및 Cowork에서 모델의 추론 깊이를 저전력 빠른 응답에서 고강도 심층 추론까지 수동으로 조정할 수 있습니다. 둘째는 Claude Code를 위한 “동적 워크플로”(Dynamic Workflows, 연구 미리보기)로, 단일 작업에서 수백 개의 하위 에이전트를 병렬로 조정하여 수십만 줄 규모의 전체 데이터베이스 마이그레이션을 완료할 수 있습니다. 또한 빠른 모드(Fast Mode)는 속도가 기존보다 2.5배 빨라지고 비용은 이전의 3분의 1로 줄었습니다. Anthropic은 또한 더 높은 성능의 Claude Mythos급 모델이 "향후 몇 주 내"에 모든 고객에게 공개될 예정이지만, 사이버 보안 방어 체계가 아직 완성되지 않아 현재는 제한된 미리보기 단계에 있다고 밝혔습니다.

Anthropic | TechCrunch

https://www.anthropic.com/news/claude-opus-4-8