世界を動かす技術を、日本語で。

ChromeのGemini

概要

Google Chromeに統合された Gemini AIアシスタント の主要機能と利点を紹介。 ブラウザ内での 即時要約・質問応答・作業補助 が可能。 ページ内容の理解や選択肢比較 など、幅広いシーンで活用。 ユーザー主導の操作性プライバシー管理 にも配慮。 今後は iOSや多言語対応 も順次拡大予定。

ChromeのGemini:AIアシスタント機能の概要

  • GeminiはGoogle Chromeに統合されたAIアシスタント
  • 現在開いているタブの内容に基づき、要点の把握や質問応答が可能
  • 記事やページの要約機能 で主要情報を迅速に取得
  • 複雑な概念や新しいトピック も分かりやすく説明
  • 製品比較や仕様の抽出 など、情報収集作業の効率化
  • ブレインストーミングや思考整理 にも活用できる
  • Gemini Live機能 で音声対話やリアルタイム応答も利用可能
  • Androidでは画面上の全コンテンツに対応、iOS Chromeにも順次対応予定

操作方法とカスタマイズ性

  • Geminiはユーザーが明示的に起動したときのみ動作
  • ChromeツールバーのGeminiアイコン または 設定済みショートカットキー で起動
  • 自然言語での質問や入力 に対応し、ページ内容を活用した回答を提供
  • ユーザーの操作性と制御性重視 の設計
    • Geminiが自動でアクションを起こすことはない
    • ユーザーのタイミングでのみアシストが開始

活動管理とプライバシー

  • Geminiアプリの活動履歴はいつでも確認・管理・削除可能
  • アクティビティの停止や管理も簡単
  • プライバシー保護と情報管理 に配慮した設計

利用条件と今後の展望

  • ChromeのGeminiは米国内のMac・Windowsユーザー(Chrome言語:英語設定)から順次提供開始
  • iOS版Chromeにも今後対応予定
  • 今後、多言語・多国展開も計画中
  • 動作や提供状況は端末・設定によって異なる場合あり
  • 詳細や最新情報は公式サイトで確認推奨

よくある質問(FAQ)のポイント

  • GeminiはデスクトップChromeに組み込まれており、gemini.google.comやアドレスバーの@geminiとは異なるサービス
  • 他ブラウザやChromeのWebアプリとしてのGeminiでは、ページ内容の共有やLiveモードは不可
  • Androidでは電源ボタン長押しでGemini起動可能
  • iOS Chromeは米国内の英語設定ユーザー向けに順次提供予定

まとめ

  • ChromeのGeminiは、ブラウザ上でAIによる要約・質問応答・作業アシストを実現
  • ユーザー主導の操作性・プライバシー管理が特徴
  • 今後、より多くのユーザー・環境に対応予定

Hackerたちの意見

今日の似たようなスレッド、コメント数順に並べてみたよ: https://news.ycombinator.com/item?id=45292260 https://news.ycombinator.com/item?id=45292163 https://news.ycombinator.com/item?id=45292637 https://news.ycombinator.com/item?id=45296416

Ublockの強制的な非推奨があったのに、まだChromeを使ってたけど、これで確実に移行するわ。

ウェブブラウジングの未来はTikTokモデルだと思う。自分でウェブをサーフィンするんじゃなくて、ウェブが「アルゴリズム的に」提供される感じ。これを続けていれば、自分が欲しいページが表示されて、まるで自分のアイデアだったかのように感じるよ。Geminiがどこにでもあるのが第一歩だね。

アルゴリズムが自分にとって有利に調整されてれば、これに大きな問題は感じないかな。実際、ほとんどのウェブは自分にとって不要なノイズだから、むしろそういう方がいいかも。だから問題なのはアルゴリズムのコンテンツじゃなくて、ユーザーじゃなくてそのアルゴリズムを作った会社の利益のために設計されたクローズドソースのアルゴリズムなんだよね。

無限の人々が無限のコンピュータで、最終的には自分たちが望むコンテンツを受け取ることになるよ。

これがテック系の兄ちゃんたちに任せた未来だよ。人間として、もっと良いことができるし、やるべきだと思う。

そうかもしれないけど、それってAndroidの一部であるGoogle DiscoverやChromeの新しいタブページ、(時々?)Googleのホームページにすごく似てるよね。

もう一歩進んで言うと、人間中心のウェブっていうのは、あなたに提供されるものじゃなくて、あなたの気分に合わせてその場で生成されるコンテンツなんだ。TikTokみたいな感じで、プラットフォームがキュレーターでもありクリエイターでもある。

いや、それは意味がないよ。ウェブはソーシャルメディアじゃないからね。

本当にStumbleUponが恋しい。

それはウェブをブラウジングしてるとは言えない、テレビを見てるだけだよね。それ自体は理論的には悪くないし、ほどほどなら全然問題ないけど。

そうすると、注意を引くのに十分なページが出てくるけど、短いから小さなドーパミンのヒットを常に与えてくれるんだよね。あまり面白くも長くもないから、もっとヒットを求めて追いかけることになって、何か重要なものを「終わらせた」って感じがしないようにしてるんだ。そう感じると、そこで止まって他のことをしちゃうかもしれないし。

ボタンをクリックすると、浮遊ウィンドウにテキストボックスが開いて、質問を入力するとAIが返事をする。これがブラウザベースのAIの実装としては、ほんとに期待外れだよ。実際、gemini.google.comをiFrameにしただけじゃん。

現在のページにアクセスできるから、その内容についてGeminiに質問できるんだ。

これは現代版のctrl+fとして役立つと思う。

文字通り、gemini.google.comをiFrameで表示してるだけだよね。うーん、違う?今開いてるタブの内容に全部アクセスできるし、ウェブページの画像も解析できるんだ。もし自分の代わりにブラウジングもできたら面白いけど、そしたら色んなセキュリティリスクが出てくるよね。

心配しないで!彼らには大きな計画があるから! https://research.google/blog/mechanism-design-for-large-lang...

ボタンをクリックすると、浮かんでるウィンドウにテキストボックスが開いて、質問を入力するとAIが返事をする。これがブラウザベースのAIの実装としては一番期待外れだよね。実質的にgemini.google.comをiFrameにしただけだし。まあ、膨大な数のクエリに対応しなきゃいけないから、世界中でこれができる会社は少ないし、Alphabetはほぼ自社のクラウドやAIチップ、ソフトウェアでやってるからね。フロントエンドは大したことないけど、これは大きな動きだよ。

彼らは一歩ずつ進んでるだけで、同時に複数のステップを踏もうとしてるわけじゃないんだから、それが悪いことだとは思わないよ。明らかにChromeエージェントとジェミニ3の準備を進めてるんだ。

Googleの危険なところは、ほんとにくだらないことでアカウントをバンすることだよね。今はGoogleアカウントに紐づけられたブラウジングをライブストリームするボタンがあるけど、間違ったタイミングで間違ったサイトでGeminiをクリックしたせいで、20年分のGmailやGphotos、GDriveのファイルを失う人がどれだけいるんだろう。

Appleはこれをよくやるの?iCloudが本当に価値があるのか、iPhoneで使うように常にスパムが来るから、ずっと気になってたんだよね。

Googleの危険性は、ユーザー体験が最悪なところだよね。

新しい情報を見てから寝たけど、ぐっすり眠れたよ。だって2年前にBraveに切り替えて、2ヶ月前にFirefoxにまた戻ったから。Firefoxだとやっと自分のブラウザを持ってるって感じがするし、会社に押し付けられることもないからね。

ちょっと待って、この足元の罠はどう機能するの?

ああ、Dropboxのリスク管理のやり方だね。ページを開くとランダムに写真を見せてくるやつ。サイト内のどのページでもそう。提案:「2020年の夏休みを思い出す」。ところで、インスタグラムのクオリティを実現するために、あなたの全写真ライブラリを圧縮したいの?それで、コンピュータの写真をもっと消費させようとしてるの?最後の数セントの価値に失望してるのに。どうしたの?iCloudやAndroidデバイスの空き容量がないの?iPhoneがCMの後に撮った2つのProRes動画のせいで、AppleユーザーがApple独自の動画エンコーディングボタンを押してインスタグラムのエンゲージメントを最大化しようとしたから。Samsungが丸まって虫の殻みたいになってる。結局、あなたの全ての写真はインスタグラムに送られる運命。そこに行ったら、無断で圧縮されたあなたの写真を見て、ZSTDを棺に選ぶように強要される。だから、同意・クオリティ・有用性の三角形(進行中)で、Googleは明らかにクオリティと同意を排除して、有用なインターフェースを提供してる。みんなが求めてたものだよね。未来は今ここに。通知: あなたが圧縮アーティファクトの動画を撮った写真に2つの新しいビューがあるよ(詳細ボタン: 2つの広告同意ビュー、0の他のビュー)。あなたがGoogleが無断で圧縮したかもしれない動画の圧縮アーティファクトの写真。残念ながら、比較用の写真も同じように混乱して、圧縮されて同じくらいひどくなっちゃった。今、写真は同じに見えて、あなたは「動画エンコーディング」についてツイートしてる陰謀論者みたいになってる。みんなと同じように、全く問題ない。 「私たちはウロボロスの中にいる。パラマウントが問題じゃないのかも。もしかしたらパラマウントプラスかも。」Samsungの虫が割り込んできて、この問題は金曜日の午後2時だから待たなきゃいけないって言ってる。今、オフィスでまだ動いてる唯一のデバイスはあなたのエルモフォン。妻を説得しようとしてるけど、「だって、圧縮アーティファクトだらけの写真を投稿してる他の人たちとは違うから。」

GoogleがGeminiに提出された情報をトレーニングに使ってるかどうか、はっきりした声明を探すのに10分かけたけど、見つからなかった。彼らがそれを曖昧にしているように思えて仕方ない。なんか、そういうことに触れてるような曖昧な声明はたくさんあるのに、ちゃんと説明してないから。だから、プライベートな情報がGoogleのGeminiトレーニングデータに吸い込まれる覚悟がないなら、プライベートなページではこれらの機能を使うのは超慎重にした方がいいよ。

Googleが無料で提供するものは、ユーザーデータを集めるためだって言うのは言うまでもないよね。従来の検索は死にかけてるし、それに付随する広告も同様。彼らは代替手段を見つけてる。私たちが普段使ってるものにどんどん「注入」してくるだろうね。広告はもっとターゲットを絞ったものになるし、リアルタイムでよりコンテクストに合ったものになるよ。

法務部がGoogle Cloudに提出されたデータがGoogleと共有されているかどうかを調べてたんだけど、結論は彼らの利用規約からは不明だってことだった。利用規約は、いろんな契約への循環参照がたくさんあって、わけがわからない。

参考までに、これがアクティブになるための現在の条件だよ: * 18歳以上でアメリカにいること。 * MacまたはWindowsのコンピュータを使うこと。 * 最新版のChromeを使うこと。 * Chromeの言語設定を英語(アメリカ)にすること。 * Chromeにサインインしていること。

プライバシーセンターにちゃんと書いてあるよ。答えは明確に「はい」だね。(これはジェミニアプリについての話)「あなたのデータの使い方 Googleは、プライバシーポリシーに記載されているように、このデータを使って: サービスを提供する サービスを維持・改善する 新しいサービスを開発する サービスをパーソナライズする(詳細はこちら) サービスをカスタマイズする あなたとコミュニケーションを取る パフォーマンスを測定する Google、ユーザー、一般の人々を守る これらの利用は、サービスを支える生成AIモデルや他の機械学習技術にも及ぶ。」

ちょっと素朴な疑問なんだけど、銀行口座を見てたり、住宅ローンの申請書を見てたり、税金を払うための政府のウェブサイトを見てるときにこのボタンをクリックしたら、入力した情報がそのまま不安定なデータセットに吸い込まれちゃうの?

これがジェミニの最悪な部分だよ。バカみたいに250ドルのサブスクリプションを払ってるのに、彼らが何をトレーニングしてるのか、全然わからないんだ。

彼らはこういう声明を書く能力が確実にあるよ。企業向けの製品でそれが見えるし。私のGoogle Workspaceのジェミニアプリには、はっきりと「あなたの[ORGNAME]チャットは私たちのモデルを改善するためには使われません」って書いてある。Google Workspaceのプライバシーハブも読みやすくて、彼らがあなたのデータをトレーニングに使ってないことが明確だよ: https://support.google.com/a/answer/15706919 だから、彼らは人々が自分のデータがトレーニングに使われていないって聞きたいってことを理解してるし、それをはっきりと安心させるように言う方法も知ってる。だから、消費者向けの製品でそれが省かれてるのは、私にとってはもっと意味深いことだと思う。

Googleが現在のモデルをプライベートデータでトレーニングしたら、機密情報が常に漏れちゃうと思う。絶対に大混乱になるよ。もしジェミニがあなたのGmailやChromeの活動を漏らしたら、Googleは訴えられて、規制されて終わりだよ。でも、もし中国のAIが本当に脅威になるようなことがあったら、Googleは将来的にそのオプションを残しておく必要があると思う。アメリカ政府がプライバシーの懸念よりもそのレースを優先するのは簡単に予測できるし。

彼らはやってるよ、ジェミニプロ/ウルトラを払ってもね。

これ、めちゃくちゃシンプルに見える。バックグラウンドでブラウジングしたり、タブを参照させたりしない。今のページをそのままllmに渡してるだけみたい。数日前にClaude-codeでこんな拡張機能を作ったんだけど、FirefoxのAI機能をLibreWolfに切り替えたときに置き換えられるか試してみたんだ。結果、Claudeコードには結構簡単だった。もう少し進めて、拡張機能にブラウジングさせようとしたけど、個別のアクションは動いたけど、計画に従わせるのはできなかった。結局、コードを見回してみたら、Claudeがカーソルとかで大混乱してた。メッセージの配列を扱うのがAIエージェントにはちょっと難しすぎたみたい。今はこのGemini AIと同じものを持ってるけど、リンクをクリックできるし、ollamaとも連携してるから、もっとプライベートだよ。数時間の開発でこれができたから、Googleには感心してない。

確か、Firefox AIの主な売りはデフォルトでオフラインってことだよね。だから、トークンの請求が増えないし、データも漏れないんだ。

だから、ここでGoogleに感心してないよ。Googleは、基本的にあらゆるユーザーに合うものを作らなきゃいけないんだろうね、君が作ったものとは違って。それに、ほとんどのユーザーが自分のデバイスで重いLLMを動かせないから、ジェミニをサポートするのは明らかだよね、オラマは無理だし。

自動でブラウジングはしないと思うけど、そうであってほしいね。

創造性を発揮するためにページを変える必要はない > 読んでることについて質問がある?ジェミニに聞いてみて。開いてるタブのコンテキストを使って、関連する答えや説明を提供してくれるから、集中できるよ。フランスではページの一部がローカライズされてるけど、まだ英語の部分もあって、あんまりプロフェッショナルに見えないし、自信も持てないよね。

彼らは多分、Geminiにページを翻訳させるためのトークンの上限を超えちゃったんだろうね…

Chromeが「Chromeにログイン」っていうのを全てのGoogleサービスで始めた時に、使うのをやめたんだ。なんか、あやふやで不明瞭な方向に進んでる気がして、ちょっと気持ち悪かった。今はその信号が強くなってるね。

現時点ではログインする必要はないと思うよ。

uBlock Originを無効にしたときに離れた。今は60%がChrome、40%がFirefoxだったのが、今は99%がFirefoxで1%がChromiumになった。

月20ドルのジェミニAIプロのサブスクリプションが、チャット履歴機能を使わない場合にしかプライバシー機能が含まれてないって知った時、すごくショックだった。Google製品が大嫌いだ。

AI Studioに無限にうるさくなる機能が追加されて、Driveとの統合を有効にしないといけなくなった。ほんと、データが欲しいんだね!