AIは、ついにAIを作り始めたのか。
米Anthropicが公開したレポート「When AI builds itself(AIがAIを作り始めるとき)」が、かなり重い問いを投げかけている。著者は、AIの社会的な影響や課題を専門に調査・分析する社内研究機関Anthropic InstituteのMarina Favaro氏と、Anthropic共同創業者のJack Clark氏。テーマは「recursive self-improvement」、つまりAIが自分自身の後継システムを設計・開発していく「再帰的自己改善」である。
AIが自分で自分を改良し始める。そうなるとAIの進化は加速度を増し、知能で人間を凌駕する存在になる。その状態に恐怖を抱く人は少なからず存在する。今回のレポートに関するメディアやSNSでの反応を見ると、「AIが自分で自分を改良し始めた」とセンセーショナルに受け止める人もいるようだ。
ただし再帰的自己改良が可能になったとは言っていない。正確には「私たちはまだそこには達していないし、再帰的自己改善が必ず起きると決まっているわけでもない」と釘を刺している。
とは言うものの、その後に「多くの社会システムが再帰的自己改善に備えるよりも早く、その時が訪れる可能性がある」と警告している。
Claudeがコードの8割超を書く現場
Anthropicのレポートで最も目を引く数字は、コード開発に関するものだ。
同社によると、2026年5月時点で、Anthropicのコードベースにマージされるコードの80%超がClaudeによって書かれている。Claude Codeが2025年2月に研究プレビューとして公開される前、この比率は一桁台だったという。
さらに、2026年第2四半期には、典型的なエンジニアが1日にマージするコード量が2024年比で8倍になった。
もちろん、コード行数は生産性そのものではない。Anthropic自身も、コード量は品質を測る指標ではなく、「8倍」という数字は実際の生産性向上を大きく見せている可能性が高いと注記している。だが、それでもこの数字は、AI開発の作業の進め方が変わっていることを示している。
かつてAIは、人間が書くコードを横で手伝う補助ツールだった。いまは少なくともAnthropicの内部では、人間の指示を受けて開発作業のかなりの部分を担う作業主体になりつつある。
この変化を象徴する社内コメントも紹介されている。あるAnthropic社員は、「Claudeを本格的に使い込むようになってから、もう5カ月ほど自分ではコードを書いていない」と語っている。
作業時間の幅が、数分から半日へ伸びている
もう一つ重要なのは、AIに任せられる作業の「時間幅」が伸びていることだ。
Anthropicは、AIが自律的に完了できるタスクの長さが、おおむね4カ月ごとに倍増していると説明している。2024年3月のClaude Opus 3は、人間なら約4分かかるソフトウェア作業をこなす水準だった。1年後のClaude Sonnet 3.7では、約1時間半の作業に対応できるようになった。さらにClaude Opus 4.6では、12時間相当の作業をこなしたという。
Anthropicは、この傾向が続けば、2027年には人間なら数週間かかるタスクもAIに任せられるようになる可能性があるとしている。もちろん、これは予測であって確定ではないが、ソフトウェア開発や研究開発の現場では、「どのくらい長く任せられるか」が実用性を大きく左右する。数分なら補助ツールだが、半日、数日、数週間となれば、人間の開発者の代わりとなりえるからだ。
研究では、まだ人間の判断が残っている
開発者の代わりになりえるものの、開発を完全に任せてもいいのだろうか。AI研究をAI自身が行えるようになるのだろうか。
同社は、AI開発には大きく二つの仕事があると整理している。一つはエンジニアリングである。コードを書き、インフラを立ち上げ、モデル訓練を進める仕事だ。もう一つは研究である。どの実験を行うべきか、得られた結果をどう解釈するか、次にどのアイデアを試すべきかを判断する仕事だ。
Claudeは、前者では急速に力を伸ばしている。問題が完全には定義されていなくても、目標を与えれば方法を組み立て、コードを書き、テストし、修正できるようになっている。Anthropicによると、最もオープンエンドなコーディング課題で、Claudeの成功率は2026年5月に76%に達した。6カ月で50ポイント上昇したという。
研究実験の実行でも、Claudeは大きく伸びている。Anthropicは、各モデルに小さなAIモデルを学習させるためのプログラムを渡し、その処理をどれだけ効率よくできるかを調べている。要するに、AIに「AIを訓練する作業をもっと速く終わらせるコード」を書かせる実験である。2025年5月のClaude Opus 4は約3倍の高速化だったが、2026年4月のClaude Mythos Previewは約52倍の高速化を達成した。熟練した人間の研究者が、処理を4倍効率化するコードを書くのには、4〜8時間かかるという。
一方でAnthropicは「研究判断」については、まだ大きな壁が残っているとしている。同社はこれを「research taste and judgment」と呼ぶ。どの問題が重要なのか。どの結果を信じるべきか。どの方向は行き止まりなのか。こうした判断では、現時点ではまだ人間のほうが優れている、という
ここが、再帰的自己改善の手前にある最後の関所だと言える。
Anthropicが求める「ブレーキ」
今回のレポートでAnthropic社は、単に自社の技術力を誇示しているわけではない。
同社は、AI開発が速くなりすぎるリスクを明示したうえで、必要であればフロンティアAI開発を遅らせる、あるいは一時停止できる仕組みを世界で用意すべきだと主張している。
同社は、「社会制度とアラインメント研究が技術の進歩に追いつくために、フロンティアAI開発を減速または一時停止できる選択肢を世界が持つことは望ましい」と書いている。
ただし、一社だけが止めても意味がない。企業間、国家間の技術格差はどんどん縮まっている。1社が止めても、社会制度が変わる前に別の社が再帰的自己改善を実現する可能性は高い。
なので世界中の主要AIラボが、同じ条件で停止に合意し、互いに実際に止まっていることを検証できる仕組みが必要だとしている。
もちろん、これは簡単ではない。AIの訓練はミサイル基地より隠しやすい。こっそり続ける誘因も大きい。Anthropic自身も、この種の検証体制を作る難しさを認めている。
それでも、世界が協力して、研究停止の検証を行える仕組みを作るしかない。
たとえAIが自分で自分を改良できるフェーズに進化しなくても、人間の手によるAI改善自体が加速し続けている。
外国を敵とみなし、自国のメリットしか考えない人が多ければ、AI研究を遅らせることなど夢のまた夢。世界中が手を取り、自国のことよりも人類全体のことを優先しなければならない時代に、われわれは立っているのだと思う。
参考ソース:
Anthropic「When AI builds itself」
https://www.anthropic.com/institute/recursive-self-improvement

湯川鶴章
AI新聞編集長
AI新聞編集長。米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』(2015年)、『次世代マーケティングプラットフォーム』(2007年)、『ネットは新聞を殺すのか』(2003年)などがある。趣味はヨガと瞑想。妻が美人なのが自慢。