世界を動かす技術を、日本語で。

Show HN: 「Perplexity Comet」のオープンソース代替品

概要

  • YC発のスタートアップBrowserOSによる オープンソース・プライバシー重視 のPerplexity Comet代替案
  • 招待不要 で即ダウンロード・利用可能、GitHubや公式サイトから入手
  • ローカル実行・データ非送信、広告や検索会社のようなインセンティブなし
  • Chromiumベースで 高いセキュリティ と自動アップデート機能を搭載
  • 少人数体制 ながら、今後も積極的な開発とコミュニティの意見募集

BrowserOS:Perplexity Comet代替のオープンソース・プライバシー重視AIブラウザ

  • BrowserOS は、YCスタートアップが開発する Perplexity Cometのオープンソース代替
  • プライバシー最優先設計 :ユーザーデータはローカル端末に保存、外部サーバーに送信しない
  • 招待システム不要 :公式サイトまたは GitHub から即ダウンロード・利用可能
  • ローカルLLM対応 :Ollamaなどで ローカル大規模言語モデル を利用可能
  • BYOK(Bring Your Own Keys) :自分のAPIキーを利用し、 高額な月額プラン不要
  • サーバー実行不要 :AIエージェントが 各自のブラウザ内で動作、操作の様子をリアルタイムで観察可能
  • デモ動画 :短いデモを https://bit.ly/browserOS-demo で公開

開発背景と技術的特徴

  • ブラウザが新たなオペレーティングシステム となる未来を見据えた開発思想
  • AIエージェントが メール・ドキュメント・ブラウザ履歴等の機密情報 へアクセスする時代への備え
  • オープンソース・プライバシー重視 の選択肢が必要という信念
  • 広告・検索企業ではない ため、データ収集や不透明なインセンティブ構造なし
  • ChromiumのC++ソースコードを独自にパッチ適用 し、 Google Chrome同等のセキュリティ を実現
  • 自動アップデート機能 によりセキュリティパッチや定期的な更新を提供
  • Chromiumの1,500万行のC++コード を扱う開発体験
    • CursorやVSCodeでは限界があり、 grep でコード検索・修正
    • ClaudeなどのAIコード支援も有効活用
    • M4 Max MacBook でバイナリビルドに約3時間

今後の展望とコミュニティへの呼びかけ

  • 2人の少人数チーム で開発を継続
    • 歴史的にFirefoxも3人からスタート、 小規模開発の伝統
  • プライバシー重視+ローカルLLM対応ブラウザ の重要性を強調
  • AIエージェントが 膨大な個人データ を扱う時代における選択肢の提供
  • コミュニティからのフィードバック・コメント を積極的に募集

Hackerたちの意見

おめでとう!プロジェクトを持続可能にするための計画はどうなってるの?お金の面や開発・メンテナンスの観点から。

俺の予想では、これはただのElectronアプリか、ChromiumラッパーにOllamaラッパーを使ってるだけだと思う(ブラウザを制御するための無料オープンソースライブラリはたくさんあるし)。

ありがとう!計画としては、他のオープンソースプロジェクトと同じように、エンタープライズ版のブラウザのライセンスを販売するつもりだよ。

Linuxのロードマップはどうなってるの?MacやWindowsは持ってないから。

これについては認識してるよ。来週の初めには準備が整う予定!まだ2人のチームだから、いろいろとやることがあるんだ。

俺はこれをブラウザの拡張機能として使いたいな、独自のブラウザアプリとしてはあまり好みじゃない。

俺たちもブラウザの拡張機能として作りたかったけど、良いエージェントコパイロットを作るにはChromiumのC++コードレベルでいろいろ変更が必要だと強く信じてる。例えば、Chromiumには各ウェブサイトのアクセシビリティツリーがあるけど、それをChrome拡張機能用のAPIとして公開してないんだ。アクセシビリティツリーにアクセスできれば、エージェントの実行が大幅に改善されるよ。ウェブサイトとやり取りするためにC++でいろいろな変更も進めてるところで、クリックやインデックス付きの要素などの機能を追加してる。これを実現するためにJSを注入することもできるけど、20〜40倍遅くなるんだよね。

実は私たちも同じことを考えてたんだ。エージェント機能を実装するのに、ブラウザ全体は必要ないよ。ブラウザ拡張機能の限られた権限で全部実装できる。Googleがすぐに展開するゼロデイのエクスプロイトパッチもたくさんあるし、GoogleがChromiumにプッシュしない他の機能もあるからね。日常的なブラウザにはランダムなオープンソースプロジェクトは信頼できないな。rtrvr.aiをチェックしてみて、私たちはあなたのワークフローに合わせたAIウェブエージェントのブラウザ拡張機能だよ。

OpenAIが今夏に(おそらくオープンソースではない)ブラウザを立ち上げるという噂がある中で、これはすごくワクワクするね。Discordに参加したから、すぐに試してみて報告するよ。ローンチおめでとう!

ありがとう!ブラウザ戦争が始まったね。 > OpenAIが今夏に自社のブラウザを(おそらくオープンソースではない)発表するらしいよ。絶対にオープンソースにはならないだろうね。平行世界では、OpenAIは非営利で実際にオープンソースのAIだったかもしれないね :)

これがhomebrewに登場するのを見たいな!

おお、それいいアイデアだね!やってみるよ!

--- どうやって作ったの?私たちはChromiumのC++ソースコードに自分たちの変更を加えているから、Google Chromeと同じセキュリティを持っているんだ。セキュリティパッチや定期的なアップデートのための自動アップデーターもあるよ。つまり、Chromiumのリリースごとにブラウザを再構築するってこと?それがリスクなんだよね。しばしば、無害に見えるコミットメッセージでChromiumに変更が入って、90日後にCVEリファレンスからリリースされることがあるから。

いい質問だね。今のところ、Google Chromeが基づいているChromiumのリリースの上に構築しているよ。

これはchrome拡張機能のnanobrowserに似てるね。 https://github.com/nanobrowser/nanobrowser

デモでの歯磨き粉購入は、これらのタスクの難しさを示してるね。歯磨き粉自体が非常に具体性がなくて、巨大なリストからランダムに選ばれた感じだった。過去のアクションがガイドになるタスクもあれば、そうでないタスクもある。失敗ケースが多いよね。以前買った歯磨き粉がもう手に入らないかもしれないし。そうなったらどうするの?結局、この特定の例でどれだけ時間が節約できたのか、結果をダブルチェックしなきゃいけないからね。これが、Amazonが最初に想定していた購入体験でAlexaをダメにした理由だと思う。もっと明確に時間の節約がわかる非自明な例を示した方がいいし、失敗ケースを最小限に抑えるべきだね… それか、失敗ケースからどう回復するのかを見せる方がいいかも。特定の問題に対してカスタマイズされたUIがもらえるの?チャットで話しかけるの?この世界は簡単じゃないよ。頑張って!

いいポイントだね!確かに、エージェントブラウザの分野はまだまだ初期段階だよね。私たちもようやくスタートしたところで、高価値なニッチなユースケースを絞り込もうとしてるんだ。繰り返しになるけど、時間を節約できる意味のあるユースケースは少ないよね。一例として、Walmartのサードパーティーセラーは、競合商品の価格を適切に設定するために、何度も(1日に複数回)価格をチェックしてるんだ。これって、今のエージェントブラウザで簡単に自動化できると思う。

あなたのGitHubリリースページに共有されたWindowsの.zipが、Windows Defenderにトロイの木馬としてフラグ付けされてるんだけど、そもそもなんで.zipなんだろう?

これはただの警告だよ。今、Microsoft Windowsの署名を設定する作業を進めてるところなんだ。

これはPerplexity Cometのオープンソースの代替品じゃないよ。これは本物、オリジナルって言ってもいい。Perplexityについて言えば、私にとってこの会社とその製品ラインは、AIの素晴らしいものに対する代替品のように思えるんだ。