概要
- AGI(汎用人工知能)の目標は、多様なタスクをこなせるプログラムの実現
- 現状のAI研究は、圧縮と汎化をキーワードに進化中
- World ModelやGenieなど、新たな方向性が注目を集める
- GPT-5は期待ほどの飛躍ではなく、業界全体の成長速度も鈍化傾向
- AI分野の競争激化と、OpenAIやGoogleなど主要企業の動向が今後の焦点
AGIの課題とアプローチ
- AGI の目標は、 多様なタスクを自律的に実行できるプログラム の開発
- プログラムに「何でもできる」能力を直接組み込むことの困難さ
- Pythonにおける
import everythingのような万能ライブラリの不存在 - あらゆる状況に対応するために 膨大な手作業コーディング が必要となる非効率性
- AGI研究のキーワードは 圧縮と汎化
- 計算資源やメモリ消費を抑えつつ、広範な「行動空間」をカバーする能力
- ディープラーニング による汎化の実現
- 大量のデータから 圧縮表現 を学習
- LLM(大規模言語モデル)は膨大なテキストを数十GB程度に圧縮し、多様なタスクをこなす能力を獲得
LLMの進化と驚き
- GPT-3など初期モデルでも チェス対戦 のような応用が可能
- テキスト模倣だけでなく、 汎用的なスキル も学習
- LLMの進化により、単なるテキスト生成を超えた能力の獲得が明らかに
マルチモーダルAIとWorld Model
- AI研究の新潮流は、 テキスト以外のデータ圧縮 への拡張
- テキスト+画像、テキスト+画像+動画など、 マルチモーダルモデル の重要性
- 「世界全体を正確に表現できるモデル」は究極的に有用との仮説
- World Model による現実シミュレーションの可能性
- 例:Tibetの天気を調べる際、Web検索ではなく現地をシミュレートして答えるAI
- ロボットの複雑な動作計画や環境ナビゲーションも実現可能性
Genie 3とGoogleの新たな挑戦
- Googleが発表した Genie 3(Generative Interactive Environments) の登場
- テキスト記述から インタラクティブな仮想空間 を生成
- GPTやGeminiがテキスト、VeoやSoraが動画生成、Genieは ゲーム空間生成 を担う
- Genieの世界は数分間限定だが、従来より大きな進歩
- 長い文脈の一貫性確保という過去の課題が克服されつつある状況
- Genie 3は、他モデルの訓練データ生成など幅広い応用が期待
- 例:Waymoのような自動運転車のシミュレーション学習
AI研究の公開とGoogleの方針
- Googleの研究論文は 社内プール で管理され、製品化されると未公開になる傾向
- Genie 3やGenie 2の詳細論文は未公開、Genie 1の論文のみ確認可能
GPT-5の現状と業界の反応
- GPT-5は「 革命的進化」ではなく、GPT-4の改良版
- 業界の期待値が高すぎた反動で、 評価はやや低調
- ベッティング市場でも、Google Gemini 2.5の方が高評価との見方
- AIの進化ペースが 2020~2023年の急成長期から鈍化 傾向
- ハードウェア(GPUクラスタ)の整備状況も進化のペースに影響
AI停滞論と現実
- 一部で「AIは停滞した」「これ以上進化しない」との声
- 実際には、 人間の幼児よりも少ないデータで高い汎用性 を持つLLMの驚異
- AGIの実現が「すでにWebブラウザでアクセス可能」との認識も
- AIの進化が雇用や社会構造に与えるインパクトの大きさ
OpenAIとGoogleをめぐる業界構図
- OpenAIの ブランド力 と消費者認知度の高さ
- 競合他社(Meta、Safe Superintelligence等)による 人材流出
- GoogleのTPUファームによる計算資源の優位性
- 業界内での「反OpenAI連合」の形成
- 重要人物の離脱や移籍が与える影響
今後の焦点と展望
- LLM分野の「 勝者総取り」構造の可能性
- OpenAIは高い企業価値と投資を正当化する必要性
- 業界の信頼・評価の維持が今後の生き残りに直結
- AIの進化は一時的な停滞があっても、 新たなパラダイムや応用 の出現で再加速する可能性