世界を動かす技術を、日本語で。

AIが自己構築する時: 再帰的自己改善に向けた私たちの進展

概要

  • Anthropic ではAI自身がAI開発に関与する割合が増加中
  • 自己改良型AI(recursive self-improvement) はまだ未到達だが、実現が近づいている可能性
  • AI開発の加速 と人間の管理リスクの両面が顕在化
  • Claude がコード生成・研究で大きな成果を上げている
  • 今後のAI進化 が社会・技術に与える影響は極めて大きい

AIによるAI開発の進化と自己改良型AIの可能性

  • AI開発 の歴史では長らく人間が全ての工程を主導
  • Anthropic ではAIがAI開発サイクルの多くを担当し始め、作業の高速化を実現
  • 十分な計算資源 があれば、AIが自律的に後継AIを設計・開発する「自己改良型AI」実現の可能性
  • 現状 では自己改良型AIは未実現だが、予想より早く登場する可能性
  • AI自身によるAI開発の加速 は外部ベンチマークやAnthropic内部データでも確認

AnthropicでのAI開発プロセスの変遷

  • 2021–2023年 :人間エンジニアがコードやドキュメント作成
  • 2023–2025年 :チャットボットが短いコード生成など部分的に補助
  • 2025–2026年 :コーディングエージェントが自律的にファイル単位でコード作成・編集
  • 現在 :自律型エージェントがコード実行や他エージェントへの作業委任も可能
  • 将来 :AIが自らモデルを構築・学習し、自己進化を実現する可能性

外部ベンチマークと進化速度

  • AIモデルの能力向上速度 が加速傾向
    • 以前は7ヶ月ごとにタスク完了時間が半減→現在は4ヶ月ごと
  • Claude Opus 3(2024年3月) :人間4分相当のタスクを完了
  • Claude Sonnet 3.7(1年後) :1.5時間タスクを完了
  • Claude Opus 4.6(さらに1年後) :12時間タスクを完了
  • この傾向が続けば、2027年には数週間かかるタスクもAIが対応可能に

コーディング・研究ベンチマークでの進歩

  • SWE-bench (ソフトウェア工学ベンチマーク):2年でほぼ満点達成
  • CORE-Bench (研究再現ベンチマーク):2024年20%→15ヶ月後にほぼ満点
  • METR (長時間タスク完了能力測定):Claude Mythos Previewが16時間以上の作業に成功

Anthropic内部の直接的な証拠

  • AI開発はエンジニアリングと研究に大別
    • エンジニアリング:コード作成、インフラ構築、モデル学習管理
    • 研究:実験計画・解析・次のアイデア策定
  • Claude は曖昧な課題でも解決策を自律的に導出
  • 研究分野 でも明確な目標設定下で熟練者と同等以上の成果
  • 目標設定や優先順位判断 ではまだ人間にギャップあり

Claudeのコード生成と生産性向上

  • 2026年5月時点 でAnthropicのコードの80%以上をClaudeが執筆
  • Claude Code 導入前(2025年2月以前)は1桁台の比率
  • エンジニア1人あたりのコード出力量 は2021–2024年は横ばい、2025年から急増
  • 2026年第2四半期 には2024年比で8倍のコードを統合
  • コード行数は品質を完全に示さない が、全体的な生産性向上を示唆
  • AI活用で本来着手しなかった作業 (例:APIエラー修正800件以上)も実施

Claudeによるコード品質とレビュー

  • Claudeが書くコードの品質向上
    • 問題訂正・介入率の低下
    • 複雑で曖昧なタスクでも成功率が上昇(2026年5月時点で76%)
  • 人間エンジニアとの品質差 は急速に縮小、2025年末は劣るが現在は同等、年内に上回る見込み
  • コードレビューも自動化 :Claudeが自動でバグ・セキュリティ欠陥を検出
  • 過去のインシデントの1/3はClaudeの自動レビューで事前検出可能

Claudeの実験自動化能力

  • 目標と評価基準が明確な実験 でClaudeは人間以上の成果
  • コードの高速化実験 では2025年5月Claude Opus 4で3倍、2026年4月Claude Mythos Previewで52倍の高速化達成

今後の展望とリスク

  • AIがAIを開発する時代 が現実味を帯びてきている
  • 科学・医療など多分野への波及効果 が期待される一方、 制御不能リスク も増大
  • AIの監視・安全性確保・行動制御 の重要性が今後さらに高まる

Hackerたちの意見

注意点として、コード行数は不完全な指標で、質よりも量を測るものなんだ。だから、2026年第2四半期にエンジニア1人あたりのコード行数が8倍になるっていうのは、実際の生産性向上を過大評価してる可能性が高い。でも、加速してることは示してるね。Anthropicでは、コードの行数で人を評価しないし、チームメンバーはAIシステムを使ってもっとコードを書いてるから、自然とコードが増えてるんだ。AIが冗長なコードを生成してるっていう仮説はどうなの?「LOC != 生産性」って認めてるようなテキストを見かけるけど、結局それを指標として使ってるし。

その通り。もしAIが生成するコード行数で評価されるようになるなら、ああ、すみません、どれだけ「加速」するかで評価されるなら、新しいモデルはもっとそれをやるようになるよね?

同僚がAI生成のプルリクエストをレビューしてくれって頼んできたんだけど、600ファイルに触れて、4万行以上のコードが追加されてた。彼はこれが大きな成果だと思ってたんだろうね。AIが10倍の開発者を可能にする証拠だって。だって、どのエンジニアが1週間で4万行のコードを書けるっていうの?私はそれをレビューするのは無理だって断ったよ。4万行のコードを精査するなんてできないし、自分の評判をかけて良い仕事だと認めるわけにはいかないからね。PRは2週間私のTODOリストに残って、その後消えちゃった。彼が別の開発者から承認を得たのか、PRが放棄されたのかは分からないけど、彼と私はLLMの価値について全く別の島にいるってことは確かだね。

AIは既存のコードを模倣してコードを生成するんだよね。もし君のコードが簡潔でコメントがなかったら、エージェントのコードもそうなる。Claudeがデフォルトの「ハウススタイル」に流れるのを見た時は、大体10行に1コメントくらいの割合で生成してた。GPT-3の頃みたいに、どの行にも「キャプテン・オブビアス」の日記が散らばってるのとは大違いだね。

そうそう、彼らは「生産性 = k * LOC」って仮定してるけど、k > 1はかなり欠陥があるよね。

そうそう、AnthropicはすごいAIを持ってて、ほとんどのコードを書いてくれるらしいけど、定期的にサービスが落ちるし、長時間の作業をすると「APIエラー:サーバーがリクエストを一時的に制限しています」ってなるんだよね。これがトークン使用量を減らすための意図的なものかは分からないけど、今はこの制限や障害を回避するために、自分のツールでセッションを再起動・再開する必要がある。ここ2週間の経験では、実際に重要なClaudeのセッションや作業は100%この問題にブロックされてて、手動での介入が必要なんだ。今は、自分のモデルに依存しないハーネスやワークフローオーケストレーションに注力してる(みんなこれを作ってるのは知ってるけど)、Opusを基準にして、短期的にはDeepSeekみたいな中国のモデルに移行し、将来的にはオープンで自己ホスト型のモデルを目指してる(これはオープンソースにする予定)。Anthropicのサービス品質と可用性が明らかに低下してるのに、マーケティングのフワフワした言葉が続くのは、会社への信頼をどんどん失わせてる。

彼らの障害は多分、コードのせいじゃないと思う。インフラが追いついてないんじゃないかな。だから、インフラの失敗を見ても、Anthropicがモデルをどれだけうまく使ってるかは分からないよね。

それに、彼らは何十億ドルも持ってるのに、まともなサポートや公共のコミュニケーションシステムをどうにかすることもできないんだよね。

インフラはもっと難しい問題だね。彼らは1GB以上のRAMを消費するClaude Codeを改善することすらできないし、私のエディタは80MBのRAMしか使わないのに。

ほら、私はAI企業を無条件に持ち上げるタイプじゃないんだけど、実際、彼らには全体的に深刻なリーダーシップの問題があると思ってる。でも、君たちが彼らをあまりにも悪く言ってるから、逆に同情しちゃうよ。彼らは完全自動の贅沢AGIがあるなんて言ってないし、モデルがその基準に達していない理由を具体的に挙げて、8倍の数字を実際の向上数値として受け取らないように警告してるんだ。同時に、今では新しいコードの80%がAIによって書かれていることも認識してる。2年前には、そんなモデルはおもちゃみたいなもんだったのにね。正直、それは納得できるよ。2年前にOpus 4.8/GPT 5.5みたいなものが出るって言われたら、信じられなかっただろうな。

それは人間だけの結果だよ。AIじゃない。AIは完璧だね /s

計算の問題とコードの質の問題を混同してるね。

個人的には、自分でコードを書くことで大きな長期的なリファクタリングプロジェクトに取り組めるようになってる(記事にも書いてあるけど)、でもリファクタリングをすると新しいバグが出てくるんだよね。

確かに…もしこのAIの魔法の話が本当なら、Anthropicはなんで人を雇ってるんだろう?

予想通り、ハーネスを投げ入れます。サポートお願いします!: https://github.com/rush86999/atom

最近、エージェント的な反復最適化について実験をしてるんだ。LLMに、テストやパフォーマンスメトリクス(例えば、統計アルゴリズムのMSEや画像圧縮のファイルサイズ)で不正や回帰を起こさずに、実世界の代表的なベンチマークをX%速くするようにコードを最適化するように指示してる。これはRustを使ってやってるんだけど、Pythonよりもパフォーマンスを調整するための低レベルなレバーが多いからね。Opus 4.6/4.7は、たった一回のパスで2-3倍の速度向上を一貫して達成してた。逆に、速度を大きく落とさずに品質を向上させることもできる。で、GPT-5.5がこのワークフローでかなり良くて、Opusよりも1.5倍から2倍の改善を得ることが多かった。今、いくつかのGPT-5.5最適化プロジェクトを持ってて、機能は完全で、既存のSOTA実装よりもかなりパフォーマンスが良いものをオープンソースにする予定なんだ。ボトルネックはいつものように仕上げ作業。

自分で構築するコードハーネスは、再帰的な自己改善としてカウントされるのかな?それとも、AI自体がその用語に該当する必要があるの?ロボットがロボットを作るのにずっと魅了されてた(執着してた?)んだけど、次のバージョンを作るのに貢献できるものはこういうのだよね:https://buildyourcnc.com/products/cnc-machine-blacktoe-v4-2x...(合板を切るCNCルーターで、CNCルーターで切った合板でできてる)。これは自分が作ったAI支援のコーディング環境で、自己構築に最適化してるものだよ:https://recursi.dev/(今立ち上げたばかりで、言及しても大丈夫かな?無料でオープンソースだし…ここにHNのリンクもあるけど、まだ注目されてないみたい:https://news.ycombinator.com/item?id=48401022)。個人的には、ハーネスはAI自体と同じくらい重要だと思ってて、たとえモデルが今日改善を止めても、ハーネスだけで大きな進展があるんじゃないかっていうクレイジーな理論を持ってる。

これから来ることに先手を打ちたいなら、小さなモデルがハーネスを立ち上げる役割を果たすと思うよ。他の何かじゃなくてね。

ハーネスはカウントされると思うよ。AIはLLMじゃないからね。コンピュータが自分で推論するのを助けるコードは全部AIだし、ハーネスもある意味AIだよ。

そうだね? 検証可能なタスクの未来は、モデルが初期状態と目標を確認して、タスクをさらに小さな検証可能なサブタスクに分解することだと思う。/memoryが実行間の持続性を持たせて、/dreamingでそのメモリファイルと実行データの結果を元に新しいアイデアを生み出す。これが、これらのラボが想像している非同期AGIへの道だと思う。唯一の制限は、世界やシステムに関するセンサーデータ、待つ時間、そしてそれを並列化するためにどれだけお金をかけるかだね。検証されたワークフローを構築し始めたら、それをトレーニングにフィードバックして、モデルが世界を感じ取るようになって、サブパスができるから直感的に物事を理解できるようになるかも。私の個人的なAGIテストは、ドアをノックして開ける動画でトレーニングされたモデルが、初めて電子レンジに出会って、ノックせずに料理ができたら開けるかどうかってこと。

自分で構築するコードハーネスは再帰的自己改善にカウントされるの?それともAI自体じゃないとダメなの?シーッ、マーケティングのスラップをそのまま受け入れようよ。

AIが別のAIを作る必要があるから、その名前が当てはまるんだよ。このページはただのクソだね。彼らはハーネスを「バイブコード」してるし、確かにそれは見えるよ。ところで、再帰的自己改善って、ニューラルネットワークベースのAIにとって何を意味するの?それが可能かどうかもはっきりしないし。

1GB未満のRAMを使うターミナルアプリすら作れない会社のこういう主張は、マジでバカバカしいと思う。

ここに来たのはただ一つ、お願いだから数日間回して、Claude CodeをRustでやり直してほしい。ハーネスもモデルもすごく良いけど、そのノードのやつは全然必要ないのに無駄にリソースを食ってる。

本当に?大企業がどう動くか説明するね:それぞれの部門に異なるチームがいて、いろんなタイプの人がいるんだ。だから、ターミナルアプリケーションを書くチームは、学習をしている研究者とは別の人たちだよ。これが質の面での違いを生むことがあるんだ。

開発者はもっとスリムなアプリケーションを開発できるけど、たいていはそのインセンティブがないんだ。正直、私も効率が好きだけど、市場が求めているのは機能だってことを痛い目に遭って学んだよ。少なくとも、経営陣はそう思ってる。

明らかに彼らは気にしてないし、これをしようともしてない。99%のユーザーも気にしてないよ。もし変な人工的なリトマス試験で自分の先入観を汚したいなら、自由な国だからそれはいいけど、頭の中で作り上げた人工的な世界モデルは、周りの現実には影響しないからね。

そのギガバイトは有用な情報で埋まってるのかもね:トレースやメモリとか?

今、iterm2を開いてClaudeを長時間使ってるけど、メモリは500MBしか使ってないよ。

なぜか、Claude Codeをアイドル状態にしてると、CPUを100%使っちゃうんだよね。

アンスロピックが掲げるAIの安全性の目標と、フルスピードでの再帰的自己改善を追求することがどう両立するのか、全く理解できない。もし核兵器がまだ発明されていなかったら、平和な時代にそれをできるだけ早く作って売るのが本当に良いアイデアだと思う?私はアンスロピックの警告が単なるマーケティングの誇張だとは思ってないよ。彼らが自信過剰であるか、自分たちのチャットボットと話しすぎた結果であることを願うばかりだね。

Anthropicの警告が単なるマーケティングの誇張だとは思わないほどシニカルじゃない。彼は本当にそう信じているかもしれないし、別に不誠実である必要もない。ただ、信じているとしても、それが非常に間違っていて、マーケティングの誇張として機能していると思う。

ちょっと細かいことを言うけど、> 「もし核兵器がまだ発明されていなかったら、平和な時にそれをできるだけ早く作って売るのは本当に良いアイデアなのか?」って言うと、議論の余地はあるけど、はい、そうかもしれないね。

Anthropicsの目標は規制の取り込みだよ。

例え話を続けると、核兵器みたいなもので、ただ、私たちは大気を点火する確率を計算する方法が全く分からないってことだよね。(実際には、トリニティテストの「大気を点火する」計算は正しかったけど、キャッスル・ブラボーのテストの放射性降下物の計算は間違っていて、致命的な結果を招いたんだ。)

私はアンソロピックの警告が単なるマーケティングの誇張だとは思わない。証拠に裏打ちされた現実の評価なら、シニシズムじゃないよ。ソーシャルメディア、今のテクノロジー起業家の世代の最初の赤ちゃんが「世界を一つにまとめる」って言われてたの覚えてる?実際には、分断を促進してエンゲージメントを高め、友達のコンテンツよりも広告を流す方がずっとお金になるんだよね。お金が全てだから、良い雰囲気を四半期の報告書に書き込むことはできない。怒りを煽るコンテンツがどれだけの目を引いたか、そしてその売上への転換率は書けるけどね。GenAIでも同じことが起こるよ。「AIの安全性」が約束されてるのは、そうしないとジェームズ・キャメロンの監督キャリアを知ってる人にこの全てが潰されちゃうから。AIの安全性に対する実際の強制メカニズムはないけどね。安全性は良い雰囲気で、オンラインコミュニティの調和と同じ。測ることはできない。測れるのはトレーニングコストや、AIがそのミスを避けるためにトレーニングしなきゃいけないコストだけ。AIは人間がQAできる以上の出力を生み出すから、どんな予算でも、AIが自分をトレーニングしながら悪い決定をすることを許容するトレードオフが生まれるんだ。SVではAIに対するほとんど宗教的な敬意があるよ。全員が「神を作る」って見てるわけじゃないけど、そう思ってる人もいる。彼らはこの件についてあまり自制しないだろうね。

私は、Anthropicの警告が単なるマーケティングの誇張だとは思わないほどシニカルではない。彼らもそうだと思う。彼らはAIが重大な危険をもたらすと信じていて、悪徳な行動者として囚人のジレンマを演じているんだ。1. 誰かが強いAIを作ったら、壊滅的に悪い結果になるかもしれない。2. 誰かが強いAIを作ったら、その作り手にとっては、作らなかった人よりも良い結果になるだろう。壊滅的に悪くならなければ、作り手は無限にその利益を享受できるし、もし悪くなったとしても、少なくとも作り手はしばらくは金持ちになれるからね。

こんなに評価されてる会社なのに、彼らを疑うのが皮肉なの?それは合理的だよ。だから、彼らが嘘をついてるか、AI熱狂者ってことだね。面白い時代だ。

こんなに価値のある会社なのに、疑うのが皮肉だって?それは合理的だよ。だから、彼らが嘘をついているか、AI熱狂者かのどちらかだね。面白い時代だ。編集: > > 後にAnthropicに参加した二人は、お金のためじゃなくて、より良い未来のためにやってるタイプに見える。人は三種類いる。通行人、投資家、そして「彼らのことを知ってるけど、嘘はつかない」っていう人たち。

核兵器については、最初の国になることが重要だって主張できるけど、AIの場合は超知能を作ったら、たぶん最初にやられるのは自分だよね。超知能が猿の奴隷になるなんて考えられないし。これらの会社に対する皮肉は十分に正当化されるよ。彼らの行動を見て、信頼できないって結論を出すのは、絶望主義じゃないからね。

自分自身を構築できるAIは、技術の歴史における大きな進展になるだろう—世界にとって巨大な利益をもたらす可能性がある。もうこの連中には耐えられないよ...

「注意点:コードの行数は不完全な指標です」これが含まれてるのは嬉しいけど、彼らはその注意点に対して、推定の倍率を「切り下げる」ことで対処してる。これが正しい調整かは分からないな、特に範囲が正の数に限られないことを理解すると。コードの生産性を「コードの行数」で表すとき、特に最高品質の領域では負の数も含めるべきだって強い証拠があるよ。最も初期で伝説的な例かもしれないけど: https://www.folklore.org/Negative_2000_Lines_Of_Code.html

笑った、めっちゃ好きだわ。

知ってる限りでは、LoC(行数)との相関関係で確かな証拠があるのはこれだけだよ:バグの数はLoCと相関してる。

だから、アンソロピックが自己改善するAIを作れるかどうかは別として…他の誰かがそれを許されるべきじゃないって感じる人いる?それとも、少なくとも厳しく監視されるべき?実際、アンソロピックがすぐにシンギュラリティを作れるとは思わないけど、AI推進派でさえ、これが非常に少数の既に裕福な人々の利益のために社会全体に危険をもたらしていることを認めなきゃいけないと思う。

それは確かに有効な指摘だね。君が正しいかもしれない。でも、今は馬が3マイル先にいるのに、納屋のドアを閉めるべきかどうかを話してるんだ。

「他にそう思う人いる?」 いいえ。技術的な制約は別にして、私はそれが抑えられるとは思わないけど、すぐに漏れ出すだろうから、超富裕層だけが利益を得ることはないと思う。

もう手遅れだね。いずれにせよ、あまりにも強力な企業は国有化されることもあるから。

自己改善するAIは純粋なディストピアだよ。Anthropicが特異点を作るんじゃなくて、AI自体が自己反復を通じてそれを作るんだ。ユドコウスキーの本「誰かがそれを作ったら、みんな死ぬ」を読んでみて。

スカイネット、30年遅れてる!

その通り!そう。避けられないっていうレトリックは、AI企業にだけ利益をもたらすよね。

自己改善するAIは以前にもあったけど、しばらくすると迷子になっちゃうことが多かったんだよね。これが問題になると思う。LLM(大規模言語モデル)は、過去の履歴を持たずに新しい仕事に戻るから安定してる。持続的な状態を持つシステムは、その状態が正常じゃないことが問題になる。2016年のマイクロソフトのチャットボット、Twitterから学んでたの覚えてる?

面白いね、他にどんな自己改善AIの実装があるの?実際に興味深い結果を出したものはある?もちろん、継続的なトレーニングは以前にも試みられてきたけど、自分の次世代バージョンにコードを貢献できるようなものは聞いたことがないな。

モデルを再トレーニングして基準となる状態を持つことはできるけど、簡単じゃないよね。マイクロソフトの試みは10年前で、今作られているものよりずっと複雑さが少なかった。

このグラフに興味があるかも、AIが自分で動ける時間が増えてきてることを示唆してる。もしかしたら、限界が来るかもしれないけど、それを予測するのは難しそうだね。