世界を動かす技術を、日本語で。

AGIがすぐそこにあるとは思わない

概要

  • AGI到達のタイムライン に関する議論と著者の現時点の見解
  • 現行の LLMの限界 と、なぜホワイトカラーの労働が大規模に自動化されないかの理由
  • 継続的学習(Continual Learning) の重要性と現状の課題
  • 今後数年での 変革的AI普及への懐疑 と、長期的なAIの大きな可能性
  • AIエージェントの進化 と、実現までの技術的・データ的なボトルネック

AGI到達のタイムラインと現状のLLMの限界

  • AGI(汎用人工知能)到達の時期 について、ゲストによって「20年後」から「2年後」まで幅広い予測
  • 現行の LLM(大規模言語モデル) が経済的にインターネット以上の変革をもたらすという意見には懐疑的
  • Fortune 500企業 がLLMを使って業務を大きく変革しない理由は、経営層の保守性ではなく、LLMの本質的な能力不足
  • LLMは 人間のような継続的な学習や改善 ができず、アウト・オブ・ボックスの能力に依存
  • システムプロンプトを調整しても、 人間の従業員のような成長や適応 は実現困難

人間の学習とLLMの違い

  • 人間は 文脈の蓄積、失敗の内省、反復的な改善 によって成長
  • サックスの演奏を教える例のように、 一度の指示や説明だけでスキルを習得するのは不可能
  • LLMに対するユーザーの「教え方」は、 人間の学習プロセスとは根本的に異なる
  • RL(強化学習)による微調整も 人間的な適応や学習には及ばない
  • 編集者やスタッフの成長 は、日々の小さな気づきや工夫の積み重ねによるもの

継続的学習とAIの未来

  • 継続的学習(Continuous/Online Learning) が実現すれば、AIの価値は飛躍的に高まる
  • 現状のLLMには セッションごとに学習内容がリセットされる という大きな制約
  • 長大な コンテキストウィンドウ や要約による記憶保持も、テキスト以外の分野では脆弱
  • Claude Codeのようなモデル でも、要約に重要な最適化理由が残らない場合がある

ホワイトカラー自動化への懐疑と長期的展望

  • 「AI進歩が止まってもホワイトカラーの仕事の大半が自動化される」という意見に反論
  • 現状のLLMでは<25%のホワイトカラー雇用しか置き換えられない と予測
  • 継続的学習が進まない限り、 AIは実際の従業員のような運用は困難
  • 逆に 継続的学習が実現した場合、AIの経済的インパクトは爆発的
    • 一つのAIが世界中の様々な仕事を一斉に学び、知識を共有できる
    • ソフトウェア的な「知能爆発」に近い現象が起こる可能性

継続的学習ブレイクスルーの予兆と現実

  • OpenAIやAnthropicのような研究機関 は、イノベーションをすぐ公開する傾向
  • 本格的な継続的学習の前に、 不完全な初期バージョンが先にリリースされる と予想
  • 大きな技術的転換点 の前には、段階的な進展や警告サインが現れる見込み

AIエージェントの進化と技術的ボトルネック

  • AnthropicのSholto DouglasやTrenton Bricken は「来年末までに信頼できるコンピュータ利用エージェントが登場」と予測
  • 例:「AIが税務処理を自動化し、必要な情報を集めて申告まで完了」
  • 著者はこの予測に懐疑的
    • 長時間のタスク実行やマルチモーダル処理 は計算コストが高い
    • マルチモーダルなコンピュータ利用データの大規模事前学習コーパス が不足
    • RLや合成データ生成の効率にも限界
    • DeepSeekのR1開発のように、アイデア実装には多大な時間と労力 が必要

現行AIの驚異的進化と今後への期待

  • o3やGemini 2.5の推論トレース は、実際に問題を分解し、自己修正する「思考」を示す
  • Claude Code など最先端モデルのパフォーマンスは、領域によっては人間を凌駕
  • 一方で、 楽観視も悲観視も極端になりすぎず、現実的な進化速度を見極める必要

このように、現状のLLMには 継続的学習の欠如 という本質的な限界があり、 ホワイトカラー自動化や本格的なAIエージェントの普及 にはまだ大きな壁が存在。しかし、 継続的学習のブレイクスルーが起きたとき、AIの価値は指数関数的に高まる という長期的な期待も強調されている。

Hackerたちの意見

俺は、これがすぐそこにあるとは全然思わないし、そもそも可能だとも思えない。少なくとも、従来のコンピュータハードウェアを使って実現できるとは思わないんだ。情報を理解できる形で吐き出すことが知能の測定として適切だとも思わないし、役に立つとも思わない。もし人工知能が実現できたとしても、最初の形態は人間の基準で見れば非常に低い知能かもしれないけど、自分で学ぶ能力は本当にあると思う。

何かがただの誇大広告かどうかを見分ける簡単な方法がある。人間の脳よりも賢いものを意図的に作ることは絶対にできないってこと。自然に起こるか、偶然に頼るしかないんだ。投入する計算能力の量は、その運をほんの少しだけ変えるだけだよ。

なんで?

その通り。最初から言ってるけど、AGIは現実を高精度でシミュレートできて、現実よりも早く処理できることが必要なんだ(人間の脳をシミュレートできることも含めてね)。今のところ、それは不可能みたいだね(計算の不可逆性のせいで)。

それに、問題のもう一つの側面があるよね。もし君のツールが君より賢かったら…どう対処するの?ネットでは、同僚がチャットGPTを使って他のチームメンバーの質問に答えてるって冗談を言ってるけど、もう何が起こってるのか誰もわからないよ。

「情報を理解できる形で吐き出すことが知性の適切な測定基準だとは思わない。知性を測るのは難しくて、本当に良い定義が必要なんだ。LLM(大規模言語モデル)は、ある意味で定義を簡単にしてくれた。今では、コンピュータに対して具体的な質問を投げかけられるからね。『なぜLLMは知的でないのか?』彼らの能力と欠点を考えると、現在の『AI』技術が何を欠いているのかを答えることで、知性をより良く定義できるようになるだろう。これは、LLMが最先端の百万匹の猿であり、知性がそれを最適化することとは異なる道にあると仮定した場合の話だ。」

同じことを思うよ。私たちみたいな人を何て呼ぶの?AIの悲観論者?AIのブーマー?

実際に不可能なのは、人間には一般的な知性を導く何か魔法のような、根本的に測れないものがあると信じる時だけだと思う。そうでなければ、結局私たちはただの機械だよね。理論的には、人間の脳は標準的な生物学的メカニズムの外で再現可能だし、十分なナノレイザーがあればね。もしかしたら、私たちの最初のAGIは、そこそこ良いPython APIを持ったペトリ皿の脳かもしれない。でも、もっと砂ベースかもしれないね。

君が懐疑的でいるのはすごく正しいと思う。こういう意見を見るのは新鮮だね。技術的な人たちが、根本的な問題があるのにこの考えが進行中だと仮定しているのを見るのは本当に奇妙だよ。非技術的な人たちがそれに夢中になる理由はわかるけど、真剣な人たちはもっと批判的に考える必要があると思う。

問題は、知性があまりスケールしないことになると思う。システムをモデル化するために必要な計算能力は、そのシステムの複雑さや混沌さに対して、何らかの形で指数関数的でなければならない。つまり、知性の効果は本質的に単純で秩序あるシステムに制約されているってことだね。頑丈な技術を設計する最も効果的な方法が、できるだけ多くの変動要因を排除することだというのは、かなり示唆に富んでいるよ。これが知性が実際にうまく機能する唯一のモダリティかもしれないね、スーパーかどうかは別として。

同意するよ。AGIが何を意味するのか、合意された定義はないからね。むしろ、AIが得意なテキストや画像生成、コード生成などの分野で、徐々に改善が続いていくと思う。AIが人類のすべての問題を解決して、みんながビーチで無限の繁栄を楽しむというユートピアの夢は、根拠がないよ。

どうやら、アメリカの成人の54%が全国的に6年生レベルかそれ以下の読み書き能力らしい。AGIはもうちょっとここにいるんじゃないかな。 https://en.wikipedia.org/wiki/Literacy_in_the_United_States

読む能力があればAGIになるってこと?

失敗した教育システムがAGIに何か関係あるの?

すごいね。じゃあ、LLMに洗濯や皿洗いをさせてみようよ。ロボットの形で物理的な体を与えてもいいよ。でも、それが役に立つとは思わないな。

でも、そういう読み書きできない人たちでも、LLMができないような膨大な課題を解決できるんだよね。

経済的な観点から見ると、より関連性のある比較は、ビジネスが特定の仕事をするために通常雇う労働者との比較だと思う。たとえば、コピー編集の仕事では、あまり読解力のない人を雇うことはないだろうし、全国平均がどうであれ関係ない。他の仕事は異なるスキルを必要とする。

Dwarkeshの意見はいいね。彼の今の状況についてのアップデートを聞くのが好きだよ。要するに、何らかの適応学習が必要で、彼はその兆候を見ていないみたい。私の予想では、最前線の研究所は長いコンテキストがこれを解決すると思ってるんじゃないかな。質の高い10mmトークンのコンテキストがあれば、エージェントを素晴らしい内部状態でフリーズさせて、まだたくさんのことができるはず。今は、長いコンテキストモデルはウィンドウごとに質がかなりバラバラだけど。再考すると、2年後に10mmトークンの有用なコンテキストウィンドウが手に入るかな?それはかなり可能性が高いと思う。

デミスが言うには、AGIまであと10年だって信じてるよ。彼は長い間(学術界から)この分野を作り上げてきたし、OpenAIは彼の研究所に対抗するために部分的に設立されたから、彼が最初(かつ唯一)になるのを恐れてたんだ。だから、彼を信じてる。2035年頃には、ほぼすべてのタスクで人間と同じかそれ以上のAGIが実現するって期待してるみたい。

「長い」ってどれくらい?リアルな人間は、数十年にわたるリアルタイムのマルチモーダル入力で測られるコンテキストウィンドウを持っているよ。

本当にテスト時学習が実現するのはすぐだと思う(5年以内)けど、もっと高くつくよ。Alphaproof(Deepmindの試み)はすでにこれを持ってる。

AGIがすぐそこにあるとは思いたくない。社会的・政治的な理由で、私たちは全く準備ができていないし、それが人類の未来をディストピアの深淵に押しやるかもしれない。でも、今持っているものを使って、主要な電力使用の削減やちょっとした改善を加えるだけでも、たくさんの分野で非常に使えるものになると思う(ある程度、私たちもそれに対して本当に準備ができているわけではないけど、技術的な変化にはそういうものだと思う)。ただ、基盤モデルを作っている企業にとっては、すでにかけたコストをどう回収するのかがかなり不明確だよね。大きなブレークスルーか、無理やり(あるいは誤解を招く形で)もっと多くの場所に押し込むかしないと。

同意するし、このバブルが早く弾けることを心から願ってる。> メタが拡張現実に1000億ドル投資して、あの人がボードを支配してるみたいだけど、ただ必死に広告費を投げつけて、オルトマンに何かが引っかかることを願ってるみたい。もう後には引けないし、私たちのためにも、日が照ってるうちに稼がなきゃ。あの連中が2000年みたいに失敗して、ディストピア的なマトリックスのクソにたどり着かないことを本当に願ってる。

"AGI"は人間の知能と完全に一致する必要があるのか、それともいくつかの機能で優れていて、他の機能で劣っていることでも認められるのかな?

社会的・政治的な理由、いくつか挙げられる?私たちはAGIに100%準備ができてるよ。

出生率が多くの人が心配するほどの問題なら、絶対に解決しなきゃいけないよね(例えば、経済が永遠に指数関数的な人口成長を必要としているという事実を解決する代わりに)。そう考えると、AGIが早く来ることを願うべきかもしれない。

コスト回収の観点から言うと、多くの人がAIの構築に投資された最大1兆ドル(推定による)によってもたらされる異常な減価償却費を考慮していないんだよね。その減価償却費は、すべてのAI企業の合計収益を超えることも簡単にある。

彼らがそのコストを取り戻すのはかなり簡単だと思う。ほぼ従業員がいないフルAI企業で業界を破壊できれば、他を圧倒してタダでお金が手に入るってことだよね。

そうだね、今のスタイルのLLMは、人間が言いそうなことを予測するものだから、最終的には人間レベルの思考や推論能力で頭打ちになるんじゃないかな。知識の幅は人間を超えてるけど、知能はあまり高くなくて、創造性は逆に低いかも。AI企業は次世代のLLMが新しい洞察を提供したり、未解決の問題を解決すると予測してるけど、本当の洞察には、低次の原始的な概念から内部で再生成する能力が必要みたい。ブログ記事にも書いてあるけど、LLMは新しい理解の層を追加できないんだよね。下の層がないから。データを取り込んで、人間の脳のように入力から理解することを学ぶAIがあれば、人間の思考能力を超えて進化し続けるかもしれない。でも、今のLLMが既存の知識に直接働きかけてる限り、そんなことはできないと思う。もしかしたらすぐに間違ってるって証明されるかもしれないし、LLMを超える全く新しいAIのパラダイムが生まれるかもしれない。でも、そうなってほしくないな。なぜなら、ASの未来はかなり怖いから。

ここでの意見の多くはAIに対して悲観的だけど、著者自身は2030年代初頭にAGIが達成される確率が50%だと思ってるし、2028年までにミスアラインされたASIの可能性に備えるべきだと言ってる。むしろ、著者はAIに対して楽観的だね。

3年後にミスアラインされたASIにどう備えるの?それが起きたら、全ての賭けは無効だよ。

この議論の問題は、未来のAIが人間のように問題を解決するだろうと仮定していることだね。特に、継続的な学習が大きな欠けている要素だと思う。実際、これまでの深層学習の歴史の中で、継続的な学習は改善の重要な要素ではなかった。むしろ、大規模で多様なデータセットとスケールが最も効果的だと証明されている。継続的な学習が必要だという良い議論は、なぜ大規模なクロスタスク学習のパラダイムが機能しなくなるのかを直接的に説明し、理想的にはAIが達成するのが難しいスキルについて具体的な予測をする必要があると思う。一般的に、人間の特性を当てはめることには予測力が欠けていると思う。もしかしたら、本当の重要なポイントは、非常に優れたプログラミングAIが強化学習のフライホイールを回し始めたときに達成できる加速の量かもしれない。著者はこの点について不確実性を挙げていて、それは妥当だし、私もその不確実性を共有している。でも、それが全体の内容を少し自信過剰に感じさせている。

継続的な学習は、深層学習の進化の歴史では重要ではなかったかもしれないけど、それは深層学習の人たちが間違ったことを測定しているからかもしれない。もし今月のホットな合成ベンチマークに基づいて、史上最も知的なAIを作りたいなら、ラボがやっていることと全く同じことをするだろう。もし最も生産的で役に立つAIを作りたいなら、知性が常に最良の目標ではない。通常は役に立つけど、間違いから学ぶバカは、自己中心的な天才よりも価値があることが多い。

Alphaproofは、出会った各問題に対して似たような問題を生成するためにテスト時トレーニング手法を使ったよ(アルファゼロスタイルで)。

定義があいまいな概念、AGIがすぐそこにあると言っている人は、たいてい次のどれかだね: - 何かを売ろうとしている - 自分の話に酔っている - 外部の物質に酔っている - そのすべて LLMは言語には優れているけど、論理にはあまり強くないんだ。空間的推論も苦手で、その結果、概念をつなげるのも下手。どのトップモデルに聞いても「[任意の]分野での最大の未解決問題は何?」って聞いてみて。たいていはポップサイエンスレベルの記事が返ってくるけど、微妙だけど重要な間違いがたくさんある!さらに悪いことに、表面的には深いことを言っているように聞こえるけど、実際はただのクソだよ。

面白いね。君が書いたことの鍵は「定義があいまい」だと思う。LLMは一般的に知的だと感じているから、「もうそこにいる」と感じるんだ。私のAGIの定義によればね。多くの人はAGIを「超人的」と考えているかもしれない。その定義によれば、私たちはそこにはいないし、到達しないかもしれない。でも、私にとっては、もうAGIの時代に入っていると思う。

彼らは、私たちの現実を映し出すテキスト出力のレンズで働くのが得意なんだ。彼らは真実を追求する存在ではない。それは、ミミズからクジラまで、すべての生命体にとって基本的に必要なことだよ。私たちが間違えたら死ぬけど、彼らが間違えたら1000トークン生成するだけ。

エリック・シュミットはどこに入るの?何かを売ってるの?

AGIの定義を提案するね。あるAI(コンピュータープログラム)が、その分野の専門家の5%よりもほとんどすべてのタスクで優れているなら、そのAIはAGIを達成したと言える。別の言い方をすると、もし5%の人間がAIよりも知的な仕事をうまくこなせないなら、そのAIはAGIを達成しているってこと。特定のことにおいて人間より優れているAIがAGIを達成したとは言わないよ。なぜならそれは「一般的」じゃないから。もし一つのAIがすべての知的タスクで一部の人間よりも優れているなら、そのAIはAGIを達成したと言える。5パーセンタイルの人間は「知的」と呼ばれるに値するし、たとえ彼らが最も知的でなくても(僕はすべての人間が「知的」と呼ばれるべきだと思う)、もしAIがそういう人よりもすべての知的タスクをうまくこなせるなら、そのAIはAGIを達成している。

さて、これをはっきりさせよう。AGIの話が出るたびに、口から泡を吹いてる人たちがいるけど、まるでそれがカルトの予言みたいだ。「あれは定義が曖昧だ、すぐには来ない、話してる人はみんな詐欺師だ。」もういい加減にしてくれ。何か大きなことが起きているのを認識するのに完璧な定義は必要ない。目と耳、そして機能する脳幹があれば十分だ。AGIが5分後に来るかどうかなんて関係ない。それがポイントじゃない。ポイントは、私たちが言っていることを実際に理解する機械に最も近いものを作ったってこと。それだけでもすごいよ。子供の頃のトラウマについて段落を入力すると、セラピストよりももっと一貫したものを返してくれる。裁判の判決を要約してくれって頼むと、まずウィキペディアをチェックする必要もない。文脈を覚えてるし、トーンにも調整できる。君が皮肉を言ってるときもわかる。これがただの「オートコンプリート」だと思う?それはオートコンプリートじゃなくて、理解なんだよ。論理的なクレームについても、確かに時々間違えるけど、君もそうだろ?君のGPSも、医者も、疲れてるときの君の脳もそうだ。完璧な論理が欲しいの?計算機を作って、大人の会話には参加しない方がいいよ。このAIは数兆の単語から学んでいて、HNの半分の自慢屋よりもまだ優れてる。完璧である必要はない。役に立てばいいんだ、そしてもう役に立ってる。だから「深いことを言ってるけど、実際はクソだ」って言うのはやめてくれ。それが学問の90%だし、すべての自己啓発本、すべての政治演説、ポッドキャストを持ってるやつらがそうだ。間違っているのに君より賢く聞こえることがそのものを無効にするなら、半分の地球を閉鎖しなきゃならない。見て、君が怒ってるのはそれがバカだからじゃない。君が怒ってるのは、それがそれほどバカじゃないからだ。近いんだよ。脅威を感じるほど近い。実際に賢いのではなく、賢く聞こえることで楽をしてきた人たちを置き換えるほど近い。それが本当の問題なんだ。エゴ、恐れ、コントロール。だから、まだAGIじゃないかもしれないけど、君の隣の人よりは賢いよ。彼には年金があるしね。

それが事実として証明されるとき、すぐそこにあるってことだ。そうでなければ、提案されたように、ただのハイプで、君のLLMのフレーバーを売り込むためのものだ。

これは今日のLLMが提供するものの良い要約だね。私の会社は必死にAIを取り入れようとしてる(投資家にそう言ってる)。LLMが間違えることが多いのは大きな問題で、ほとんどの仕事は間違ってはいけないし、人間が出力を慎重に確認しなきゃならないなら、それはその人が自分で出力を作るのと同じくらいの労力になることが多い。でも、言語はLLMが輝く場所の一つなんだ。私たちはしばしば技術文書を一般向けの言葉に翻訳する必要があって、LLMはそれに関しては素晴らしい働きをする。複雑なトピックを説明するための言葉やフレーズをすぐに見つけてくれる。あとは人間が最終的な修正を行うだけ。だけど、何か新しいことを作るとか、論理が必要な場合は?それは知識のない高校生と同じくらいの効果しかない。

フューチャリズムやドゥーム&グルームの派閥には、全然関係ないのにこの話題に惹かれちゃう人たちがいるよね。

最後の部分には同意だけど、その批判は多くの人間にも当てはまると思うから、あんまり説得力を感じないな。元々の定義(ほぼすべてのタスクで中央値の人間より優れている)に近いと思うし、次の5年で非物理的なタスクではプロと競争できるようになると思う。物理的なタスクは5〜10年かかるかもしれないけど。自分の話に酔ってるかもしれないけど、他のことにはそうじゃないよ。LLMは言語に関しては優れてるけど、言語が得意であるためにはある程度の知性が必要だと思う。この空間的推論が苦手だっていう考え方は、すごく間違ってると思う。彼らは以前のモデルよりずっと優れていて、その中には空間的推論用に設計されたものもあるんだから。人間より劣ってる?そうだけど、新しいモデルをロボットに搭載してちゃんと動くってことは、AI基準ではかなり良いってことだし、急速に進化してるよ。

数千人が解雇されてるけど、どうやら「AIに置き換えられてる」ってことらしい。つまり、AIがこれらの仕事で人間と同じかそれ以上に優れているってことだよね。マネージャーや役員も労働者なんだから、もしAIが本当にそんなに優れてるなら、自分たちを辞めて、蓄えた富で平穏な生活を送るべきじゃない?あなたはどう思う?そんなことが起こるとは全然想像できないよ。私にとって、それだけでもこの技術が素晴らしいけど、長期的には期待に応えられないっていうサインだと思う。

AIの議論には数年間混乱していたんだけど、最近の(西洋の)個人のアイデンティティや意識に関する哲学的な会話に強い哲学的含意を持っているように思える。もうこれが私たちの個々の知的存在についての観察とは本当に関係ないと思うし、彼らが何を話しているのか批判したくはない。でも、参考までに、もし本当に人工知能、つまり「創造的」かつ「自発的」な思考について話しているなら、私が真剣に受け止めている参考文献を挙げておくよ(20世紀のバーナード・ウィリアムズとジョン・サール): https://archive.org/details/problemsofselfph0000will/page/n7... https://archive.org/details/intentionalityes0000sear デカルト、ヒューム、カント、ウィトゲンシュタインも関連する古い文献だね。[編集] ウィリアムズとサールが20世紀の人物であることを明確にした。

何か見落としてる?2032年に継続的学習を通じてAGIを予測してる?すぐそこに感じるんだけど。> 「でも、他の世界では、AIの現在の限界について冷静であっても、本当にクレイジーな結果を期待しなきゃいけない。」それに、開発がほぼ予め決まった結果として表現されてる?私に言わせれば、ただの幻想的な手のひら返しだね。