世界を動かす技術を、日本語で。

Show HN: Nxtscape – オープンソースのエージェントブラウザ

概要

Nxtscape は、AIエージェントをローカルで動かす オープンソースのブラウザプライバシー重視 で、データは自分のPC内に保存。 Chrome拡張機能 との互換性や、Ollamaなど ローカルAIモデル 対応。 コミュニティ主導 で開発、AGPL-3.0ライセンスで公開。 他のAIブラウザと比較し、 完全なオープンソースユーザー主導 を強調。

Nxtscape Browser ― AI時代の新しいオープンソースブラウザ

  • AIエージェント をローカルで実行することで、 プライバシー重視 のブラウジング体験を実現
  • ArcDiaPerplexity Comet の代替となる、 オープンソース のエージェント型ブラウザ
  • 自分のAPIキー 利用や Ollama によるローカルAIモデル対応で、データは 完全にローカル管理
  • Chrome拡張機能 と互換性があり、普段の環境をそのまま活用可能
  • コミュニティ主導 の開発体制、 GitHub で自由にフォーク・改良可能

特徴

  • Chrome拡張機能 がそのまま使える、慣れ親しんだ操作性
  • AIエージェント がクラウドではなく 自分のブラウザ 上で動作
  • プライバシー最優先 設計、 BYOK(Bring Your Own Key)Ollama 連携でデータ流出リスク低減
  • オープンソース、誰でも中身を確認・改良できる透明性
  • (今後実装予定) MCPストア で人気AI機能をワンクリック導入
  • (今後実装予定) AI搭載型広告ブロッカー でさらに快適な閲覧体験

デモ動画

  • AIエージェント による自動化デモ
  • ローカルAIチャット の利用例
  • 生産性向上ツール の操作例

開発の背景

  • Netscape 以来の「ブラウザ再発明」への挑戦、AI時代に最適化
  • Cursor のような10倍の生産性を一般ユーザーにも
  • 複数タブ管理や単純作業の自動化など、 AIエージェント による日常業務の効率化
  • データを外部に送信しない ローカル自動化の重要性を重視

他ブラウザとの比較

  • Chrome

    • Chromium の恩恵は受けるが、ここ10年大きな進化なし
    • AI機能や自動化、MCPサポートなし
  • Brave

    • プライバシー重視 だが、 暗号資産・検索・VPN など多方面に注力しすぎ
    • AI特化の開発に集中
  • Arc / Dia

    • Arc は人気だったが クローズドソース、サービス終了時にユーザー救済なし
    • Nxtscape100%オープンソース で安心
  • Perplexity Comet

    • 広告・検索会社 として、ユーザー履歴が商品化されるリスク
    • Nxtscapeローカル保存 で安心

コントリビューション・参加方法

  • バグ報告機能提案 は随時歓迎
  • Discord でのコミュニティ参加
  • Twitter で最新情報をフォロー
  • GitHub でのダウンロード・フォークが可能

ライセンス・開発者

  • AGPL-3.0 ライセンスで公開
  • Nxtscapeチーム (Nithin & Nikhil/YC S24)が開発
  • Chromium フォークによる独自ブラウザエンジン
  • Google/Meta インフラ経験者による開発体制

技術的な挑戦と今後の展望

  • Chromium の巨大なコードベースとの格闘
  • 拡張機能 では実現できない Accessibility Tree などの深い制御
  • ローカルAIエージェント によるWeb操作自動化の実現
  • タブグループ化セッション保存/復元 など生産性機能の搭載
  • 今後もコミュニティと共に進化 予定

まとめ

  • AI時代に最適化 された、新しい体験の オープンソースブラウザ
  • プライバシーとユーザー主導 を徹底
  • 開発初期段階 ながら、 GitHub で試用・貢献が可能
  • 公式サイト・GitHub :https://github.com/nxtscape/nxtscape

Hackerたちの意見

MacユーザーがChromiumをフォークして、Mac用だけのリリースをするのはどういうこと?

ハハ、ビルドが簡単だったし、俺たちが最初のユーザーだったからね :) 次はLinuxも考えてるよ。どのビルドが欲しい?

ちょっとバカな質問かもしれないけど、「エージェンティックブラウザ」って何?みんながその意味を知ってる前提で話してるけど、これって一般的でよく使われる用語なの?聞いたことないんだけど。文脈からすると、「AIの機能が追加されたウェブブラウザ」みたいな意味に思えるんだけど。

質問してくれてありがとう - 全然バカな質問じゃないよ!投稿の最初で説明すべきだったね。「エージェンティックブラウザ」っていうのは、基本的にAIエージェントがウェブナビゲーションのタスクを代わりにやってくれるブラウザのことを指してるんだ。だから、Amazonで何かを再注文したり、フォームに記入したりするのを手動でクリックする代わりに、AIエージェントがサイトをナビゲートしてそのタスクをこなしてくれるってわけ。

「エージェンティック」っていう言葉を初めて聞いたのは約1ヶ月前。今まで聞いたことがなかったのに、2日間で3、4回も聞くことになった…そのうちの1回は、俺が働いてる会社の内部のタウンホールで、リーダーシップがまるで全世界がその意味を知ってるかのように使ってたんだ。実際には初めて言及されたばかりなのに。要するに、これは自分で決定を下すAIのことなんだ。

エージェントは、calculate(expression)のようなツールを使って応答するLLMのことだよ。必要な出力を得るためにやるべきことに遭遇したら、そのツールを実行するんだ。それがシンプルなエージェンティックワークフローを定義することになる。複雑なワークフローは他のツールを含むかもしれない。例えば、LLMへの入力が、ユーザーエージェントを特定の文字列に設定するように指示することがある:set_user_agent("Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"); 他のツールとしては、ページ内の要素をクリックしたり、ページが読み込まれるときにカスタムJavaScriptを注入したりすることもあるよ。

LLM(大規模言語モデル)がタブ関連のワークフロー(タブの管理や関連するアイデアの追跡)を解決する可能性は十分あると思う。つまり、小さな関連研究アイデアを追跡して整理することだね。逆向きのパープレキシティ検索みたいな感じ。(LLMの文脈はオープンタブから来るもので、タブにアクセスするためのツールからではない)昔、タブ管理の拡張機能を作ったことがあって、みんな使ってたけど、同じ問題にぶつかったんだ。タブ管理の概念は単なるタブそのものよりも深いんだよね。

そうだね、LLMがついにタブの過負荷問題を解決できると思う。俺もこれに常に悩まされてる。便利だと思った機能をいくつか追加したんだ - タブを整理してグループ化する簡単な方法とか、選択的なコンテキストでセッションを保存して再開するシンプルな方法とか。解決してほしい問題は何?

これは完全に勝者総取りの市場だね。挑戦してみたのは素晴らしいけど、個人的にはブラウザプロジェクトは2、3人のチームには大きすぎると思う。しかも、GoogleはIOでこのことを初めてデモしてるし。正直、GoogleがChromeでやる前に、先行者利益を得るのは難しいと思うし、そもそもDiaに勝てるかも怪しいよね。ブラウザの使用でも同じことができるし、彼らはすでに良い流通を持ってる。頑張ってほしいけど、私ならまずは特定のICPがもっと必要としているものから始めるかな。野心的な技術系創業者たちがChromeを倒そうとして、無駄にした工数は本当に多いよ。(中にはChromeのフォークから始めた人もいるけどね。)でも、成功した人はいない。エネルギーは限られてるからね。

正直なフィードバックありがとう!競争が激しいのは確かだね。でも、オープンソースでコミュニティ主導、プライバシー重視のAIブラウザには市場の隙間があると思ってるよ。(Braveみたいな?)

ネットワークインスペクターで完全に見えるのに、GitHubリポジトリでLLMシステムプロンプトを隠す意味あるの?

意図的じゃないよ、webpackのプロダクションビルド中に圧縮されちゃっただけ。修正するつもりだよ。

今までのコメントは、木を見て森を見ずって感じがするな。ローカルのLLMに接続して、見たものをローカルのタイムスタンプ付きデータベースに書き込んで、やり取りするものを解析・要約してくれるブラウザには、すごい価値があると思うんだ。(ちょっと単純化しすぎだけど。)Puppeteerみたいな機能を持ってて、コードでスクリプト化したり、プロンプトからコード生成したり、マッピングしたり、記憶を助けたり、忘れたことを見つけたり、興味のあることを学んだり(これもローカルね)、広告やスパム、フィッシング、見たくないものをフィルタリングしてくれたり、自動でインターネットのタスクをこなしてくれる(これも単純化しすぎ)なんて、どんどん続くよ。25年分のブックマークがあると、もうそれだけじゃ足りない。注意を引くウェブサイトに飛んで一つのことを確認しようとして、すぐに気が散るのを防ぐために、ジャンクをフィルタリングするボディガードボットを使うことで、深いウサギ穴に落ちるのを減らせるかも。そういうサイトはうるさいノイズを作るから、ボットに「誰かがあなたのコメントに意味のある返事をしたときだけ教えて」って言えば、ノイズを減らせる。もし本当に機能するなら、個人アシスタント+ツアーマネージャー+ドアマン+ボディガード+ハウスキーパー+メカニックみたいなデジタルアシスタントを想像できる。これらはスイッチ一つでオンオフできる。2025年のインターネットの混沌に対するブラウザが主なポータルになることを考えると、悪くないアイデアだと思う!実行次第だけど、うん…このプロジェクト(や似たようなプロジェクト)がどうなるかすごく興味あるよ。

正直なフィードバックありがとう!100%同意するよ、まさにその通り!これが私たちの持っていたビジョンなんだ。私たちは90%以上の時間をブラウザで過ごしているのに、まだ基本的にはただのダムウィンドウだよね。訪れたサイトを覚えて、重要な記事をクリップして(Evernoteのウェブクリッパーを覚えてる?)、ハイライトを保存して、すべてを意味的に検索可能にするAIアシスタントがあれば、革命的だと思う。すべてはローカルのPostgresDBに保存されるから、履歴やハイライト、セッションも全部。例えば「先月の価格比較は何だったっけ?」とか「ブラウザ自動化についてのハイライトを探して」って聞けば、ちゃんと機能する。さらに、集中したいときに気を散らすサイトをブロックする自己制御機能も内蔵されてる。検索や記憶を超えて、ブラウザは実際に仕事を手伝ってくれる。タブを賢くグループ化したり(「この15個は全部Chromiumの研究だよ」)、雑務を自動化したり(「これらのサイトで2TBのハードドライブの価格を比較して」)、さらには「Discordサーバーの新しい投稿をすべて要約して」なんてことも、すべてローカルで処理される。ブラウザはインターネットの混沌を管理する手助けをすべきで、増やすべきじゃない。具体的にどんなワークフローが痛いのか、ぜひ聞かせてほしい!

これは基本的にMicrosoftがRecallでやりたいことなんだけど、それで叩かれたんだよね。これがイライラするのは、最近のAIの盛り上がりの中で唯一、私をワクワクさせる機能だから。今のところ、私の生活を実際に良くしてくれそうな唯一のものなんだ。でも、もう少し考えてみたら、私が本当に求めているのはAIじゃなくて、コンピュータが詳細なローカル履歴と検索機能を持っていることなんだ。私のコンピュータは、私がやったことをすべて覚えておくべきだ。訪れたウェブサイト、各ページでどれだけスクロールしたか、入力して削除したすべての考え… そして、完全に思い出せるべきだ!いつでも時間を巻き戻して、何が起こったか正確に追跡できるはずだ。だって、コンピュータなんだから。昨日起こったことの記憶はすでに頭の中にあるけど、それは不完全なものだ。私のコンピュータが私のために物事を覚えてくれる意味は、私よりも上手にやってくれることなんだ。検索は決定論的であるべきだ。正確なタイムスタンプを入力して、ブール演算子を含められるようにしたい。ああ、あいまいな一致や推薦、自然言語処理のレイヤーがあれば便利だけど、Luceneなどは20年以上前にローカルデータセットのためにそれを十分に良くやってくれた。共通のコーパスがあるのは素晴らしいけど、私はコーパスからトークン化された文章を得ることには興味がない。自分のコンピュータでやったことに興味があるんだ!私の視点から見ると、LLMはパーソナライズされた検索の面ではあまり価値をもたらさない。私が理解している限り、彼らのエンコーディングの性質上、実際に探していたデータを取り戻すことは不可能なんだ。もしそのデータが従来の方法で保存されてインデックスされているなら、わざわざ間接的なレイヤーを経由せずにソースデータをクエリすればよかったはずだ。これがどのように進展するのかも気になる。今のところ、LLMをどこにでも注入するというトレンドは、研究者たちが「すべて」を効率的にインデックスする方法をまだ見つけていないから、コンピュータがすべてを知っているという幻想を人々に与えるための一時的な応急処置のように感じる。でも、パーソナライズされた検索のユースケースでは、コンピュータは「すべて」を知る必要はない。画面に表示されていたテキストと少しのメタデータ(期間、カーソル位置、クリップボード、URLなど)を知っていればいいんだ。もし現在、実際のテキストをスナップショットして従来のインデックスに投げ込むのにディスクスペースが足りないからLLMが必要なら、それはそれでいいけど、次はどうするの?昨日やってたことについてあいまいに会話できるだけではダメなんだ。完全な思い出が必要なんだ。

長い間、30秒以上滞在した長いウェブページの全文をアーカイブするブラウザ拡張機能のアイデアを考えていたんだ。これはそれを実現するものだけど、もっと良くなってる。

一方で、エージェントブラウザはクールなアイデアに聞こえる。クライアントサイドでエージェントを使って自動化できるのはすごく強力だよね。けど、もう一方では、これは絶対にセキュリティのチェルノブイリになる可能性がある。ブラウザは多分、あなたのすべての敏感なアカウントにログインしてるから。ブラウザ内のエージェントは、その性質上、インターネットからの信頼できない入力にさらされることになる。プロンプトインジェクションで、数秒で人生がひっくり返る可能性もある。コンセプトは好きだけど、サプライチェーンの全員がPCI/SOC2/ISO 27001認証を持っていて、全体のサプライチェーンが審査されて、第三者のアナリストからセキュリティに関する血の誓いを受けない限り、これには手を出さないな。

これを提起してくれてありがとう!これは重要な問題だし、慎重になるのは当然だよね。だからこそ、私たちはローカルファーストでオープンソースにしてるんだ。クラウドエージェント(例えばManus.im)を使うと、自分の認証情報をブラックボックスに預けることになる。ローカルエージェントなら、コントロールを維持できるんだよ。

  • エージェントは、明示的に起動したときだけ動く
  • 何をしているかリアルタイムで確認できて、止めることもできる
  • 別のChromeユーザープロファイルでタスクを実行できる
  • そして最も重要なのは、コードがオープンソースだから、何が起こっているか正確に監査できること。

「nxtscape」は昔の「SCSI」みたいな感じがする。みんな「GPT」を完璧に捉えたね。一息で言える何かを考えてみて。素晴らしい製品だけど。

ハハ、ありがとう。今日のフィードバックを受けて、もう少しネーミングやブランディングに時間をかける必要があるかな。考えてみるね :)

これはかなりクールだね!このコンセプトにすごくワクワクしてるよ。HNでのローンチ、おめでとう!ちょっとフラストレーションのある初期体験についてのフィードバックを。

  • 提案された「トピックごとにタブをグループ化」を生産性エージェントモードで試したら、うまくいった。
  • その後、すべてのタブグループを削除してリセットするように頼んだら、こう言われた:「これはブラウザの自動化タスクです。クリックやフォームの記入、サイトのナビゲート、ウェブコンテンツの抽出などのウェブインタラクションには エージェントモード を使用してください。」
  • 「エージェントモード」を試したら、「これは生産性タスクです。タブ管理、ブックマーク、セッション、履歴、コンテンツ分析には チャットモード を使用してください。」と言われた。
  • 結局、行ったり来たりさせられた。生産性モードに戻って、少し議論した。すべてのタブグループを削除する最も近い方法は、すべてのタブを含む新しいタブグループを作成することだったけど、完全にグループを削除することはできなかった。APIが足りないのかな?全体的に、ブラウザレベルのアクションにはすべて元に戻すボタンがあればいいなと思う。もしくは、作成したタブグループを賢く削除できるようになってほしい。もっと試してみるつもり。 edit1: もう一つ変な問題があった:chromeの内部ページ(chrome://extensionsなど)でチャットインターフェースを使っていると、なぜかランダムにgoogle.comに飛ばされた。 edit2: 生産性モードにはタブをグループ解除するツールがないことを確認した。タブグループを作成するツールだけ。

フィードバックありがとう!そして、面倒な体験をさせてごめんね。デバッグして直すから。まだ初期のベータ版なんだ :( エージェントモードとチャットモードはそれぞれ別のツールがあるよ。今日の「プロンプト」は十分じゃないと思うから、もっと良い方法がないか考えてみるね。グループ解除に関しては、今のところChromeにはそのAPIがないんだ。これをサポートするように検討中だよ。うーん、何人かが「元に戻す」機能を求めているね。どう実装できるか考えてみるよ。カーソルの「チェックポイントを復元する」みたいな機能があればいいなと思う。ちょっと質問だけど、これらの生産性機能は日常のワークフローにとって重要だと思う?具体的な例があれば教えてほしいな :)

あなたの製品はBrowser Base https://www.browserbase.com/ と比べてどうなの?