世界を動かす技術を、日本語で。

ChatGPT アトラス

概要

  • ChatGPT Atlas は現在 macOS限定 で利用可能
  • ウェブ閲覧中に ChatGPTサイドバー を表示し、内容要約やデータ分析が可能
  • プライバシー設定 や履歴管理により、ユーザーがコントロールできる設計
  • エージェントモードによる 自動タスク実行 機能を搭載(Plus, Pro, Business限定プレビュー)
  • 検索・カスタマイズ・操作性 の向上を実現

ChatGPT Atlasの主な特徴

  • macOS専用アプリケーション として提供
    • Windowsや他OSには未対応
  • ウェブ全体でChatGPTを活用 できるサイドバー機能
    • 閲覧中のウェブページ内容の要約
    • 製品比較やデータ分析のサポート
  • 作業継続性の向上
    • ChatGPTが覚えておく内容をユーザーが選択
    • 必要な時に関連情報を提供
  • エージェントモード搭載
    • ChatGPTがウェブサイトと自動でやり取り
    • 旅行の調査やショッピングなど、タスクを最初から最後まで実行
    • Plus, Pro, Businessアカウント向けプレビュー提供
  • カーソル連携による即時アシスト
    • メールやカレンダー招待、ドキュメント内のテキストをハイライト
    • ワンクリックでChatGPTからのサポートを受ける
  • ユーザーによるコントロール性
    • ChatGPTがアクセスできるサイトの指定
    • 閲覧履歴の削除やインコグニートモード利用
    • ブラウザメモリの管理
  • 多様な検索機能
    • テキスト、画像、動画、ニュース記事の検索
    • 検索方法のカスタマイズ性
  • 操作性とカスタマイズ
    • タブ、オートコンプリート、検索バー、ブックマークによる簡単なナビゲーション
    • 閲覧設定や配色のカスタマイズが容易
  • インストール方法
    • ChatGPT AtlasのダウンロードはmacOSのみ対応

プライバシーとセキュリティ

  • プライバシー設定の柔軟性
    • 閲覧履歴や記憶内容の随時削除
    • 必要に応じたインコグニートモードの利用
  • ユーザー主導のデータ管理
    • サイトごとのアクセス権限設定
    • ブラウザメモリの手動管理

利用対象と提供状況

  • 対応アカウント
    • Plus、Pro、Businessアカウントでエージェントモードのプレビュー利用可能
  • 今後の展開
    • 現時点ではmacOS限定、他OS対応は未発表

まとめ

  • ChatGPT AtlasmacOSユーザー向けの次世代AIブラウザサイドバー
  • 作業効率化・プライバシー重視・直感的操作性 を実現
  • エージェント機能による自動化ユーザーコントロール性 が特長

Hackerたちの意見

これはOpenAIのPerplexityのCometに対する答えなんだね。正直、これが未来になるんじゃないかと思う。AIブラウザは本当に価値をもたらすから。でも、これって結局、あなたのことを全部知ってて、あなたの代わりに全てをコントロールできる一つのビッグテック企業が勝ち残る道を開いちゃうんだよね。オープンソースのブラウザ、例えばFirefoxが早くもっといい代替案を出してくれることを願ってる。デバイス上のLLMみたいなやつで、「クラウドに全部」っていうLLMアプローチに対抗してほしいな。もちろん、それにはビッグテックに捕まってるトップクラスのMLエンジニアが必要なんだけど。

これらのブラウザ自動化が、金融アナリスト以外にどれだけ価値をもたらすのか、今のところよくわからないな。

どんな価値があるの?自分では使ったことないけど、YouTubeのレビューを見る限り、あまり役に立たないし、フラフラしてるみたい。Siriみたいな音声アシスタントが出た時を思い出すよ。結局、タイマーをセットしたり、音楽をコントロールしたり、そんなギミック的なことしかできなかったんだよね。

自分のブラウザはLLMなしでもちゃんと動いてるよ。

オープンソースのブラウザ、例えばFirefoxが早くもっといい代替案を出してくれることを願ってる。デバイス上のLLMみたいなやつで、「クラウドに全部」っていうLLMアプローチに対抗してほしいな。これが頭に浮かんだよ。このブラウザを使うと、あらゆるウェブサイトでのすべてのアクションがOpenAIに知られちゃう。もしこれを利用したいと思っても、私の情報の巨大なローカルDBとやり取りする完全にローカルなLLMじゃないと無理だね。

新しいChromeが「エージェント的」っていうのはちょっと怖いよね。でも、それが実際に広まるかどうかが肝心だと思う。正直、そんなことはないんじゃないかな。ブラウザのエコシステムは、変革が必要なのに、意外と頑丈で、ちゃんと機能してるものは壊れない限り置き換えられないんだよね。基本的なユーザーが不便を感じるレベルまで壊れないと変わらないし、業者の圧力で強制的に変わることもあるけど。ああ、これが理性的な恐れだね。

ウェブサイトはセキュリティや使いやすさ、アクセシビリティ、プライバシー、メンタルヘルスの観点から見ると最悪だよね。これらのツールを使って、全部改善できるはずなのに、結局は同じ古いことをやってるだけで、ただ速くなっただけ。私は、ウェブページを掘り下げて、欲しい情報を見つけて、危険を排除した一貫性のある美しいUIで提示してくれるAIブラウザが欲しい。そう、バカな機械にもコンテンツをフィルタリングしてほしいんだ。「火曜日は政治なし」って言ったら、興味のあることを見つけて、政治に関する部分を取り除いてくれるべきだよね。このアプローチには新しいリスクがあるのは理解してるけど、それを考慮して作ることもできると思う。開発者に多くの権力を与えることになるのは分かってるけど、正直、オープンウェブの個々の変わり者を信じるのも、今のところはあまり良い結果になってないし、ユーザーに厳しい方法でほぼ独占されてるからね。

先週Cometをダウンロードしたんだけど、なんでAnthropicやOpenAIがそれを持ってないのか不思議だよね。常識的に考えても必要だと思う。Googleの独占が本当に影響を受けるだろうし、Appleみたいなハードウェア・ソフトウェアの独占もいつかは影響を受けるのかな。

完全にブラウザを持たれるより、明確なサンドボックスがあるブラウザプラグインの方が絶対にいいな。でも、Cometは好きだよ。

OpenAIの答えはPerplexityのCometに対するものだね。OpenAIはPerplexity/Cometの存在をほとんど知らないか、気にしてないと思う。

でも、彼らは本当にあなたのことを全て知っていて、あなたの代わりに全てをコントロールできる一人のビッグテックの勝者のためにゲートを開けるんだ。そんなのいらない、私はそれに関わりたくない。あれを使うくらいならLynxを使うよ。AIはすでに検索結果に直接入り込んでるし(広告ブロックするまで)、私が今見てるページにクソみたいなことを書いて、YouTubeでは「とにかく動画を見せてくれ」って感じで繋がらせた。私の生活を何かしら改善するAIの使い方を一度も見たことがないのに、すでに強すぎる企業にもっと私の生活やデータを渡さなきゃいけないなんて。お断りだね。私の目から見ると、皇帝が服を着ているふりをするのは本当に疲れる。

これが役立つと思うなら…こういう技術は全体主義のリーダーたちを興奮させることを忘れないで。広告が気持ち悪いと思ってたなら、Atlasは根本的なキーロガーサービスだよ。なんでAI企業があなたのブラウジングの全てをスクレイピングして記録するのを望むの?そう、GoogleはすでにChromeを通じてこれをやってる。あなたの人口統計、支出、場所、収入情報を使って広告をターゲットにして売るための予測モデルを作るのは一つのことだけど、一般的な知能を構築しようとしている会社からあなたの認知を記録してモデルを作るのは全く別の話だよ。これはトレーニングデータと認知の流出を狙ったものだ。

「あなたの人口統計、支出、場所、収入情報を元に広告をターゲットして売るための予測モデルを作るのは一つのことだけど、あなたの認知そのものを記録してモデルを作るのは全く別のことだよね。もしAtlasが成功したら、Googleがそれを真似しない理由はないよ。彼らはすでにChromeとGeminiを持ってるし、GeminiをChromeに直接組み込んで、TPUをGeminiインスタンスに割り当てれば、あっという間にAtlasになるんだ。」

私のウェブブラウザがルートで動いてるの?Atlasもルートで動いてるの?Atlasって、私が入力するものを無差別に監視するキーロガーなの?これらのことは本当なの?

よく言った!Windows版が待ち遠しいよ、使いたいからね。冗談だよ、冗談。

これは、彼らがウェブからすべてを取り込んだ後に欲しがってるトレーニングデータを集めるための良い方法に見えるね。

良い点は、彼らには防壁がないってこと。オープンソースの代替品が出てくるだろうし、少し遅れても性能がちょっと劣ってもね。

こういう技術は全体主義の指導者を興奮させるだろうね。本当に仮定の言葉を使う必要があるの?

商品ページをざっと見たけど、みんなが自信満々に集めてるデータが具体的に何なのか、よくわからない。ChromeでGoogleがやってることと何が違うのか。これらの機能のほとんどは、Geminiを使ってChromeにすでに組み込まれてると思うんだけど。Atlasのどの機能が、キーストロークを全部記録する必要があるの?それをやってる可能性はあるけど、Googleも同じことができるし、どちらも個人化された予測モデルにデータを入れる理由は同じくらいあると思う。これがChromeとどう違うのか、全然わからない。

解決策はAppleのアプローチみたいだけど、問題はそのUXがあまり好かれてないってことだね。

そう、GoogleはすでにChromeでこれをやってる。簡単な解決策:ウェブ開発者以外はFirefoxを使えばいいよ。たまにChromeの互換性をチェックする必要がある人は別だけど。

LLMのChromeプラグインは、ブラウジングに関する情報を集めてるんじゃないかと信じられなかったから使ってないんだ。これにも同じ懸念があるけど、今はただの怪しいプラグイン開発者じゃなくて、私のデータにアクセスできる巨大なソフトウェア会社だって自信を持ってる。これって実際に良いことなのか、自問自答してるところだよ…。

Private Internet AccessやNordVPNみたいな会社がAIブラウザ拡張機能やフルブラウザを作るのは、すごく価値があると思う。リクエストを匿名化して、いろんなLLMモデルを提供するんだ。プライバシー重視の企業としての評判を活かして、OpenAIやPerplexityのサービスから人を引き離すことができるよ。

OpenAIはmacOSのchatgptアプリに証明書を付けてるから、彼らが集めてるデータを監視するのが難しいんだよね。

なんでLLMプラグインが他のプラグインよりもページ上の情報にアクセスできるの?これはマニフェストの仕組みを誤解してる気がする。

これってChrome / Firefox / Edgeなどの拡張機能になるのかな?これらは拡張機能のネタになるのかな? - 「新しいタブ」でLLMプロンプト付きのカスタムUIを表示 - ユーザーのウェブページの内容をチャットUIで読み込んで、ウェブページの横に表示 - テキスト選択時に新しいUIのガジェットが表示されて、選択したテキストに対するコンテキスト機能があるChatGPTの花アイコンが出る - タブを跨いで「エージェントの個性/コンテキスト」を維持する(用語は知らないけど)

私もそう思ったんだけど、拡張機能って本当にそこまで制約があるのかな?自分のブラウザエンジンのフォークが必要なほど?投資家に対してAIのハイプトレインに乗ってるように見えるよ。拡張機能を公開するのは、ブラウザを出荷するほどセクシーでも「壮大」でもないしね。

そうだね、彼らがブラウザを作ってる唯一の理由は、もっとデータを集めるためだよ。

このデモで一番面白いと思うのは、結構意味のあるタスクをアウトソースしてることだよね…ハイキングする場所を選んだり、周りの世界についてもっと学んだりする代わりに、何をすべきか教えられて、幸せな無知の中で生きることになる。人生を生きる挑戦こそが喜びだと思うし。あと、私はOpenAIみたいな会社に自分の個人情報を全部預けるなんて絶対に無理だよ。これは明らかに、彼らがユーザーからより大きなコントロールとデータを求めてるだけだと思う。

そうそう、変だよね。LLMを使って退屈な作業を自動化したいのに!でも、ログインにMFAが必要だから、全然使えないんだよね。

ハイキング自体より、そのハイキングを探すことの方が意味があると思う。もしLLMがもっと良いハイキングを勧めてくれるなら、全然賛成だよ。ここでの言葉選び、「何をすべきか教えられる」ってのは、私のLLMとの経験とはちょっと違うな。もっとおすすめを求めたり、反論したりできるし。(余談だけど、LLMは本の推薦には全然役立たないと思ってる。)

俺も同じこと思った。Instacartでの注文を自動化してるんだよね。それってすごく小さなタスクだよ。もしかして、製品の有料プロモーションだったのかな。

いつも「フライトを予約して」か「メールを書いて」って感じだよね。まるで私たちが次にどこに飛ぶかをメールで人に知らせるだけみたい。

仕事のためにこうやって生活を自動化したい気持ちはわかるな。「先週の出荷を再注文」とか「フライトを1日ずらす」とかね。でも、個人的なことに使うのは、完全に自動化された生活に向かって滑り落ちていく感じがする。

終点は広告で、データが必要なんだよね。

私にとってAIは、若い卒業生がアシスタントとして一緒に住むようなもの。リサーチをしてくれるけど、あまりやる気はない。でも、ランチを作る?それは無理。掃除をする?絶対無理だけど、どうやってやるべきかについては話したがる。結局、ちょっと無意味に感じる。

こちらが.DMGインストーラー画面のハイライトだよ(https://imgur.com/a/Tu4TlNu):1. ブラウザのメモリをオンにする ChatGPTがブラウジング中に役立つ詳細を記憶して、より賢い応答や提案をしてくれるよ。プライバシーは守られるから安心。2. どのウェブサイトでもChatGPTに聞いてみて ChatGPTのサイドバーを開いて、要約したり、説明したり、タスクを処理したりできるよ。3. カーソルをコラボレーターにする ChatGPTがメールの下書きやレビューの作成、フォームの記入を手伝ってくれる。フォームフィールドやドキュメント内のテキストをハイライトして、ChatGPTのロゴをクリックすればスタート。4. デフォルトブラウザに設定する BOOST CHATGPT LIMITS メッセージング、ファイルアップロード、データ分析、画像生成の制限を7日間拡張できるよ。5. 準備完了 — Atlasへようこそ!ChatGPTと一緒にウェブを探索して、データとプライバシーをコントロールしながら楽しんでね。(この画面には、ChatGPTとAtlasに登録してからの日数を表示するシェア可能なPNGバッジも表示されるよ)。私の予想では、多くのChatGPT Freeユーザーが(4)のためにデフォルトブラウザにするだろうね — 制限を延ばすために。クリエイティブだね :)

デフォルトブラウザにしようとしたけど、(4) 一番怪しいのはキーチェーンへのアクセスを求めることだよね。それには「いいえ」って言った。

デフォルトブラウザに設定するためにお金を渡すのって、なんか、うーん、ちょっと反競争的でディストピア的な感じがする。

「プライバシーはあなたのコントロール下に」とか言ってる会社をどう信じられるの?全インターネットをスクレイピングして、プライバシーの基盤を侵害してるのに :)

自然言語でブラウザの履歴を検索できる機能が一番楽しみだな。5ヶ月前のリンクを探すのに10分以上かけた回数は数えきれないよ。内容は説明できるのに、タイトルを思い出せないんだよね。

AIブラウザは要らないし、その魅力が理解できない。普通のブラウザにChatGPTの拡張機能があれば十分じゃない?これは使用率やトークン数を増やすためのギミックだと思う。だから、Altmanは信用できないんだ。彼は偽の成長ばかり追求してる。

個人的には、この分野での競争を歓迎するよ。

こういう「エージェンティックブラウザ」を使ってると、目に見えないフォームで悪意のあるサイトにデータを盗まれる危険があるから、ほんと一歩間違えれば大変だよ。

OpenAIがあなたのデータを削除しても法的に保持しなければならないことにはまだ懸念があるよ。これって、あなたがこのツールにさらけ出した全てのことがどこかに永久に保存されるってことだよね。なんでこれがもっと大きな問題にならないの?プライバシーの懸念を置いておいても…これは世界で最も壊滅的なデータ漏洩になるだろうね。

彼らは文字通り、必要なら法的なケースで使うための前例を作ったんだ…なんで自分のデジタルライフ全体が召喚状の対象になることを望むの?

セールスエンジニアとして、ランダムなデモやインフラのために無作為にPRを押し出していない時は、LinkedInで人を探して紹介をもらおうとしてる。自分で本当に基本的なLinkedIn検索を試してみたんだけど、Atlasは自信満々に失敗した [0]。Kagi [1] とGoogle [2] はうまくいった。これが、私がLLMが検索エンジンに取って代わるべきではない理由の完璧な例だと思う。検索エンジンは真実を見つける手助けをしてくれる。LLMは、たとえそれが真実でなくても真実を教えてくれる。 [0] https://ibb.co/wrK2YQfG [1] https://ibb.co/4wfhS2Sk [2] https://ibb.co/spLNGYsv