プロジェクト・ジーニー：無限のインタラクティブな世界を探求する

2026年1月30日原文(blog.google)

概要

Google AI Ultra 米国ユーザー向けに Project Genie を提供開始
Project Genie はテキストや画像から インタラクティブな世界 を作成・探索できる
Genie 3 がリアルタイムで世界や経路を生成
世界のリアリズムやキャラクター制御に制限あり、今後改善予定
今後さらに多くのユーザーに 技術の提供拡大 を目指す

Project Genie：Google AI Ultra向けインタラクティブ世界生成プロトタイプ

Project Genie は米国の Google AI Ultraサブスクライバー 向けに提供開始
テキストプロンプトや画像を使い、 独自の世界やキャラクター を作成
リアルタイム生成 による動的な環境探索が可能
既存の世界をリミックスし、新たな解釈や体験を創出
Genie 3、 Nano Banana Pro、 Gemini などの先端AI技術を活用

Genie 3による世界モデルの進化

Genie 3 は多様な環境の ダイナミクスや物理挙動 をシミュレート
静的な3Dスナップショットと異なり、 移動やアクションに応じて経路を生成
ロボティクス、アニメーション、歴史的シナリオなど幅広い用途を想定
AGI（汎用人工知能）実現に向けた重要な技術基盤

Project Genieの主な機能

ワールドスケッチ機能
- テキストや画像で 環境やキャラクター を設計
- Nano Banana Pro 連携によるプレビューや微調整
- 一人称・三人称視点の切替に対応
ワールド探索機能
- ユーザーの操作に応じた リアルタイム経路生成
- カメラ視点の調整や没入型探索体験
ワールドリミックス機能
- 既存ワールドの プロンプトを基に新解釈を作成
- ギャラリーやランダマイザーで多様な世界にアクセス
- 作成した世界や探索動画の ダウンロードが可能

責任ある開発と今後の課題

Project Genie は実験的な研究プロトタイプとして Google Labs で開発
現時点での主な制限
- 生成される世界の リアリズムやプロンプト準拠性 に課題
- キャラクター制御の 遅延や操作性の制限
- 生成時間は 最大60秒 まで
- 一部の機能（プロンプトでのイベント発生等）は未実装
利用者のフィードバックを基に 継続的な改善と機能追加 を予定

今後の展望

米国18歳以上のGoogle AI Ultraサブスクライバー から順次提供開始
将来的には より多くの地域・ユーザー への展開を目指す
世界モデルの活用による AI研究・生成メディアの新たな可能性 を模索

Hackerたちの意見

これを思い出したよ。9ヶ月前のHNの投稿で、作者が自分の地元の公園の動画から世界エミュレーションをするニューラルネットワークを訓練したってやつ。インタラクティブなデモで歩き回れるんだよね。DeepMindのデモにはアクセスできないけど、動画を見る限り、アイデアが一段階進んでる感じがする。これらのアイデアの正確な系譜は分からないけど、一般的に言えるのは、ブログ投稿やインディーデモが引用されないのは残念だなってこと。

└

そうそう、似たようなコンセプトだね！ただ、計算やスケーリングのスペクトルの真逆に位置してるけど。 - あの森の小道の世界は約500万パラメータで、15分の動画でトレーニングされて、5年前のiPhoneで20年前のAPI（WebGL GPGPU、つまりOpenGLフラグメントシェーダー）で動くようにスコープされてるんだ。私が知ってる中で最小の「3D」ワールドモデルだよ。 - 一方、Genie 3は（おそらく）約1000億パラメータで、何百万時間もの動画でトレーニングされて、複数のTPUで動いてる。もしこれが一般に公開されている中で最大規模のワールドモデルじゃなかったら、驚くよ。中間規模のワールドモデルもたくさん開発されてるし（例：LingBot-World https://github.com/robbyant/lingbot-world、Waypoint 1 https://huggingface.co/blog/waypoint-1）、1年か2年以内に、ゲーミングGPUでGenieクオリティのものが遊べるようになると思う。

何度も言ってるけど、未来に生きてる気がする。古いOculusのゴーグルにこれを接続して、Genieにリアルなセーリングシミュレーターを作ってもらうのが待ちきれない！リアルな条件でセーリングの練習ができるんだ。乗りたいボートでね。もしこれらのシミュレーションを使ってゲームが作れるようになったら、大手スタジオには厳しい時代が来るかもしれないし、小規模な一人ゲームスタジオの復活になるかも。

└

…それから、リビングの中の空気圧装置。

└

これって結局、動画から推測した「雰囲気シミュレーション」じゃないの？表面的なビジュアルリアリズムは一つのことだけど、ボートを見てるだけでセーリングの正確な物理メカニクスを理解して、それをゲーム化する形に抽象化するのは全く別の話だよね。

└

どんな規模のゲームでも、常に「良いかどうか」がボトルネックになる。良いゲームを出さない小さなインディーもたくさんいるし、世界モデルがゲームデザインや楽しさを改善するとは思えない。もし間違ってたら、楽しいゲームが大量に供給されて需要が完全に飽和し、インディーゲーム開発者が目立つのがさらに難しくなるだけだと思う。

└

とても印象的な技術だけど、他の生成AIと同じ制約があるよね：不一致、不正確な物理、時間の制限、遅延、ものすごく高価な計算。セーリングシミュレーターを作ることはできるかもしれないけど、10分後には水の上を歩いてたり、風呂の中にいたりするかも。それに、小さなフェリーよりも多くの電力を使うだろうし。この技術がPS5やそれに近いもの上で動くとは思えない。

└

正直、サンフィッシュを手に入れるのは「セーリングの練習」をしたいなら、VRヘッドセットより安いかもね。

└

もしこれらのシミュレーションを使ってゲームが作れるようになったら、大手スタジオには厳しい時代が来るかも。逆に、小規模な一人でやってるゲームスタジオにはチャンスが訪れるかもね。だって、ゲームを作るのが結局は十分なプロンプトを用意することになるなら（テキストのことじゃなくて、たぶん動画データベースみたいなものになると思うけど）、AIの画像生成が「一人アーティスト」にとってのルネッサンスにならなかったように、「一人ゲームスタジオ」にとってもルネッサンスになるかは疑問だよ。楽観的になりたいけど、メディア出版の状況が持つ巨大な流通の支配力を否定するのは難しいし、それは技術とは関係ないからね。

└

そして、小規模から一人で運営するゲームスタジオの復活の兆しかもしれないね。インディーゲームは、私の知る限り、今まで以上に盛り上がってるよ。

ずっと不思議だったんだけど、FBが世界モデルに投資する気がないのはなぜなんだろう。これが彼らの「メタバース」ビジョンを解放する鍵なのに。なのに、ヤン・ルカンを手放しちゃった。

└

ほとんどの人は、コンテンツが何であれVRヘッドセットをつけるのが好きじゃないよね。結局、技術好きのニッチから抜け出せなかった。

Hacker Newsで議論の続きを見る

ハクソク