ハクソク

世界を動かす技術を、日本語で。

ジェミニオムニ

2026年5月20日原文(deepmind.google)

概要

Gemini Omni は高度な推論と創造力を融合したAIモデル
マルチモーダル対応や編集機能で 世界理解 と表現力が向上
安全性・倫理 に配慮した多段階の評価と審査体制
生成コンテンツには 透明性 を担保するデジタル透かしを付与
Google Flow や YouTube Shorts など多様なクリエイティブ用途で活用可能

Gemini Omniの特徴

推論能力 と 創造力 の両立による新しいAI体験
画像・動画・音声・テキストなど マルチモーダル な入力・出力対応
編集機能による 高精度なコンテンツ生成
- 例：手の穴で地面を拡大ズームする映像生成
- 例：動画内の指が動物おもちゃに触れると鳴き声を再生
- 例：音楽と連動してアパートの明かりが点灯する演出
- 例：バイオリニストを別画像環境に転送、バイオリンを透明化、カメラアングル変更
- 例：宇宙船を任意オブジェクトに変換
- 例：チェーンリアクション風トラックを高速で転がるビー玉のスムーズなショット
- 例：クレイアニメでタンパク質フォールディングのストップモーション解説
- 例：スキューモーフィズムで海馬の働きを声のみで解説（テキスト・シーホースなし）
- 例：アルファベット26文字をユニークな物体でテンポよく紹介、手書き風ローワーサード付き
- 例：単語ごとに異なるアニメーションでリズム良くテキストを表示

プロンプト作成ガイド

現実的かつ一貫性ある アウトプットのためのプロンプト作成支援
多様な表現 や編集指示に対応可能

安全性・評価体制

自動・人手の評価 をトレーニング中および運用後も継続実施
専門チームによるレッドチーミング で弱点やリスクを検証
自動レッドチーミング で大規模な安全性・セキュリティチェックを補完
倫理・安全性レビュー をリリース前に実施

透明性と検証

SynthIDデジタル透かし と C2PAコンテンツ認証情報 を自動付与
GeminiアプリやChrome、Searchで コンテンツの真偽や編集履歴の検証 が可能
ブログ で透明性・検証ツールの拡張情報を公開

Gemini Omniの活用例

Google Flow ：クリエイター向けAIスタジオ
YouTube Shorts ：短尺動画作成・発見・視聴
- ※Google AIサブスクリプションが必要
- ※機能はプランや地域によって異なる

まとめ

Gemini Omniは 直感的なクリエイティブ体験 と 安全性・透明性 を両立
多様なメディア での表現や編集を高精度かつ柔軟に実現
今後も機能拡張 や透明性強化を継続予定

Hackerたちの意見

ブログ記事: https://blog.google/innovation-and-ai/models-and-research/ge... モデルカード: https://deepmind.google/models/model-cards/gemini-omni-flash...

「リミットがリセットされ次第、もっと動画を作れるよ。設定で使用状況を確認してね。まだ動画は作ってないけど。Googleは、誰も試せない素晴らしいAIを作ってるね。でも、プレスリリースはありがとう。」

└

Googleはよくこういうことをするよね。見せびらかしておいて、実際には渡さない。

└

俺も！素晴らしい仕事だね。

スクロール中にブラウザがクラッシュするのは、自動再生の動画が原因だよ。表示されてない時は、IntersectionObserverを使って動画を一時停止してほしい。

└

誰かがLLMを使って作った感じだね。人間が一人もレビューしてないんじゃない？

└

サファリ？

└

それもブラウザがクラッシュしまくる。Microsoft Edge使ってるよ。

└

2017年のiPad Proでは、どの動画も再生すらしない。どっちがマシなのか分からないよ！

└

君の経験を否定するつもりはないけど、僕のWindows ThinkPad X1のFirefox 150では問題なく動いてるよ。

初めて使ってみたけど、あんまり感動しなかったな。これまでSeedance 2に何万円も使ってきたけど、システムでいくつかサンプルを試した限りでは、Google Omni FlashがSeedanceより優れてる点は見つからなかった。作った動画は、HNのプロフィールリンクにあるよ。

└

ちょっと気になるんだけど、AIが生成した不動産リスティング動画の法的な影響について心配してる？

Hacker Newsで議論の続きを見る