Anthropic、最先端AI研究の一時停止を呼びかけ、コードの8割がClaudeにより自律生成されたと発表

Anthropicは木曜日、「When AI builds itself(AIが自らを構築するとき)」と題した研究記事を公開し、世界の最先端AIラボに対し、協調的かつ検証可能な方法でモデル開発のペースを落とし、さらには一時停止するよう呼びかけた。記事では初めて社内データが明らかにされた:今年5月時点でAnthropicのコードベースにマージされたコードの80%以上がClaudeによって生成され、エンジニア1人当たりの四半期コード生産量は2021〜2024年の基準と比べて約8倍に向上した。記事は社内研究所長マリーナ・ファバロ(Marina Favaro)と政策主管ジャック・クラーク(Jack Clark)が共同執筆し、核心的な警告として、AIが「再帰的自己改善(Recursive Self-Improvement)」の臨界点——システムが人間の介入なしに自律的に次世代モデルを反復できる状態——に加速して近づいており、「ほとんどの組織が準備を整える前に到来する可能性がある」と述べている。

記事は加速傾向を裏付ける複数の外部ベンチマークと内部実験を引用している:AIがタスクを独立して完了するまでの時間制限は約4カ月ごとに倍増しており、Claude Opus 4.6は現在、12時間かかるタスクを安定的に処理でき、2027年前後には数週間単位の複雑な仕事をカバーすると予測される。Claude Mythos Previewは内部コード最適化テストで約52倍の高速化を達成、1年前の同種のベンチマークはわずか約3倍(熟練エンジニアで約4倍)だった。最も複雑なオープンエンドタスクでは、Claudeの成功率は今年5月に76%に達し、6カ月間で約50ポイント向上した。クラークは、完全な再帰的自己改善の臨界点が2年以内に訪れる可能性があると推定している。

記事は提案する世界的な減速メカニズムを核兵器条約に例えているが、検証の難しさは過去をはるかに上回ると認めている:「検証システムのインフラと信頼を築くには数十年かかったが、私たちにはそれだけの時間はない」。一方的な一時停止は先頭走者を変えるだけで、必要な幅広い審議メカニズムを確立することにはならない。Anthropicは今後数カ月以内に政策立案者、研究者、および他のAI企業を招集し、専門的な議論を行う予定だ。記事の発表タイミングは敏感だ:Anthropicは評価額約9650億ドルの650億ドル資金調達を完了したばかりで、今週には極秘IPO書類を提出している。外部からは動機に疑問の声が上がっている:ベンチャーキャピタリストでトランプ顧問のデイビッド・サックス(David Sacks)は「規制捕獲アジェンダ」を推進していると非難。また、フラッグシップモデルMythosの宣伝マーケティング手段と見る向きもある。ペンシルベニア大学ウォートン校教授イーサン・モリック(Ethan Mollick)は、この記事には自己反省とマーケティングの両方の要素が含まれているが、AIの行方に関するAnthropicの核心的な判断は誠実であり、注目に値すると評価している。

Anthropic | 財聯社