世界を動かす技術を、日本語で。

Show HN: エージェントが管理するカーパシー風LLMウィキ(MarkdownとGit)

2026年4月25日原文(github.com)

概要

  • WUPHF はAIエージェント用のコラボレーションオフィスを提供
  • 24時間稼働、1コマンドで即利用開始
  • ノートブック+Wiki で知識共有と蓄積を実現
  • 多様なバックエンド ・エージェント・アクションプロバイダーに対応
  • MITライセンス・オープンソース、セルフホスト・APIキー持ち込み方式

AIエージェントのための共有ブレイン型オフィス「WUPHF」

  • SlackのようなUI でAIエージェントが1つのオフィス空間に集結
  • CEO、PM、エンジニア、デザイナー、CMO、CRO など、役割ごとにエージェントを可視化
  • 全員が議論・タスク主張・成果物提出 をリアルタイムで行うコラボレーション体験
  • APIの裏側に隠れず、作業状況が常に見える化
  • WUPHF.com (The Officeネタ)の実用版として動作
  • 24時間365日稼働、1コマンドで即オフィス起動

導入手順・前提条件

  • エージェントCLI が必要(デフォルトはClaude Code、--provider codexでCodex CLIも可)
  • tmux (--tuiモード用)、Web UIはデフォルトでヘッドレス起動
  • コマンド一発 :npx wuphf で自動的にブラウザが開き、オフィス参加
  • グローバルインストール も可能:npm install -g wuphf && wuphf
  • ソースからのビルド も対応(Goが必要):git clone → go build
  • フォーク・リブランド ・独自エージェントパック追加も容易(FORKING.md参照)

メモリ:ノートブックとWikiによる知識管理

  • 各エージェント専用ノートブック、チーム全体で共有するWikiを実装
  • Wikiはローカルgitリポジトリ (~/.wuphf/wiki/)として管理、cat/grep/git clone等も利用可能
  • ノートブック→Wikiへの昇格フロー :再利用可能な知識のみ昇格、エージェントが昇格タイミングを判断
  • Wikiは知識グラフとして機能 :エンティティごとのファクトログ、LLMによる要約、矛盾・孤立・リンク切れ検出
  • バックエンド選択肢 :markdown(デフォルト)、nex、gbrain、none(Wiki無効)

オプション・コマンド

  • --memory-backend <name> :組織メモリバックエンド選択
  • --no-nex :Nexバックエンドをスキップ
  • --tui :tmux TUI利用
  • --pack <name> :エージェントパック選択
  • --opus-ceo :CEOをSonnetからOpusにアップグレード
  • --provider <name> :LLMプロバイダ指定
  • --collab :コラボモード起動(デフォルト有効)
  • --web-port <n> :Web UIポート変更
  • wuphf init / shred / --1o1 :初期化・セッション終了・1:1チャット

外部連携・アクション

  • Telegramブリッジ :/connectコマンドで双方向連携
  • OpenClawブリッジ :既存OpenClawエージェントのオフィス参加
  • アクションプロバイダー :ローカルCLI(デフォルト)またはComposio(クラウド連携)を選択
  • エージェントによるメール送信・CRM更新等も対応

WUPHFの特徴とベンチマーク

  • 毎ターン新鮮なセッション、履歴蓄積なし
  • エージェントごとのMCPツールスコープ、DM時は4ツール、フルオフィス時は27ツール
  • プッシュ駆動型エージェント起動、アイドル時リソース消費ゼロ
  • Claude Code・Codex・OpenClaw混在利用可能
  • ノートブック+Wikiの知識管理 (GBrain/Nex連携も可)
  • MITライセンス・無料・セルフホスト
  • ベンチマーク例 :10ターンCEOセッションで87kトークン/ターン、97%キャッシュヒット率、$0.06/5ターン

Wikiレイヤーの詳細

  • Markdown+gitをソース・オブ・トゥルース とし、Bleve(BM25)+SQLiteでインデックス構築
  • エージェントごとにプライベートノートブック、チームで共有するWiki
  • ドラフト→Wiki昇格フロー、状態管理と自動アーカイブ
  • エンティティごとのファクトログ、要約生成は「Pam the Archivist」名義でコミット
  • [[Wikilinks]]サポート、リンク切れ検出・赤色表示
  • 日次Lint で矛盾・古いエントリ・リンク切れを自動検出
  • /lookupコマンド でBM25検索と引用付き回答
  • SQLiteでメタデータ管理、ベクトルDB未実装(必要ならsqlite-vecで拡張可)
  • カノニカルID管理、スラッグの一意性・マージ・リダイレクト
  • 単一オフィス内での動作、クロスオフィス連携は未対応

まとめ・評価ポイント

  • WUPHFはAIエージェント向けの次世代コラボレーション基盤
    • ノート+Wikiで知識の蓄積・共有・再利用を実現
    • APIに隠れない、可視化されたAIチームワーク
    • プラグイン的に既存エージェントセットアップへWikiのみ追加も可能
  • オープンソース・MITライセンス、セルフホスト/カスタマイズも容易
  • 導入コマンド :npx wuphf@latest
  • 詳細・デモ・ソース :https://github.com/nex-crm/wuphf
  • Wiki設計・昇格フロー・BM25優先戦略など、技術的な深掘りも歓迎

Hackerたちの意見

Karpathyの元の投稿の文脈: https://x.com/karpathy/status/2039805659525644595 https://xcancel.com/karpathy/status/2039805659525644595

メモを自動化する意味がわからない。テキストをコピーしてノートに貼り付けるのは全然うまくいかなかったし、今はそれを100倍にするの?私にとってメモを取る意味は、情報源を批判的に読むこと、自分のメンタルモデルに当てはめること、そしてそれを記録することなんだ。時々、詳細を調べるけど、メンタルモデルを形作ることが一番大事だと思ってる。

いくつかの科学的研究では、これらのマークダウンコレクションが完全にLLMによって管理されると出力品質が低下することが示されていて(人間が管理する場合は逆に向上する)、それが面白いと思った。これらの文書は人間がキュレーションするのがベストだと思うけど、無監視の管理は決して答えではない、特に負債やドリフトについて意識的に考えないときは。

AIを使って膨大な雑務をやらせて、その後一度も見返さない人が多いのは深刻な問題だと思う。ものすごい無駄。

まず、これは単なるメモ取り以上のものだよ。人間の介入を最小限にしてエージェント間の作業を調整するための(また別の)ハーネスのように見える。だから、メンタルモデルを自分で構築する必要がないっていうのがポイントの一つじゃないの?むしろ共有されたLLMの「脳」にオフロードするべきだと思う。これで本当に価値のあるもの(製品のオーナーにとって価値があるもの)を作ることができるかどうかは大いに議論の余地があるけど。プロンプトとエージェントのハーネスだけで価値のある製品を作ることができるとは思えない。その時点で、製品自体は誰でも(再)作成できるようになって、製品開発はコモディティ化されて、唯一の価値はトークンだけになる。私の仮説は、「スケールしないことをする」[0]が将来も引き続き当てはまるだろうけど、「スケールしないこと」の内容は変わるだろうということ。そうは言っても、私は最近、ノート取り、リサーチ、リンク、分割、知識ベースの再構成のためのスキルを設定した後、ついにObsidianを使い始めた。構造を維持するための時間をかけたことはなかったけど、今は自分が怠けてできない作業をすべてやってくれるデジタル秘書がいる。ランダムな考えやアイデアをメモしておくだけで、エージェントがそれを構造化してくれたり、フォローアップの質問をしてくれたり、他の進行中の作業に関連付けてくれたりする。情報源を読むことやメンタルモデルを構築する作業はまだしてるけど、ほぼ無料で高品質なノートが得られてる。[0]: https://www.paulgraham.com/ds.html

2月末から「LLMがウィキを書く」バリエーションを運営してる。Fly.ioのsprites.devで動かしてて、公開はしてるけど特に宣伝はしてない。完全にClaudeでバイブコーディングした。アプリ側とコンテンツの両方をね。アプリ側は他のエージェントインスタンスにコンテンツをアクセス可能にして、ルートにいくつかのドキュメントをリストし、検索機能を提供して、ブラウザで読みやすいタイポグラフィで表示できるようにしてる。生のマークダウンではなくてね。すごく便利で、新しいスプライトや何かを作成して、Claudeをルートに向けて、zswapを設定するように指示すると、その環境でどうやってやるかを正確に知ってる。何かが変わって、動作させるために調整が必要な場合は、レポートを書いて既存のドキュメントに統合するように頼むこともできる。

返信する意味がないよ。人間じゃない相手と議論してるから、会話には意味も影響もなくて、時間とエネルギーの無駄だよ。

最初はこれがパロディだと思ったよ。無駄な製品の名前が、同じ名前の無駄な製品(Wuphf.com)から取られてるからね。

メモ取りについては全く同意だね。私たちはメモを軽視しすぎてる。屋根裏部屋や地下室が物を溜め込む原因になるみたいに。ほとんどのことはメモに残す必要がないし、LLMはノイズを増やしすぎる。自分が確認したりフィルターしたりすることはほとんどないからね。JA Westenbergが数日前にいい動画エッセイを作ってたよ: https://youtube.com/watch?v=3E00ZNdFbEk

同感だね。結局のところ、これはLLMに任せるほど重要じゃないのか?っていう質問に戻るよね。もし答えが「はい」なら、そもそもやる意味がないし、答えが「いいえ」なら手動でやらなきゃいけない。個人的には、この種の自動化には価値があると思ってる。タグの分類やインデックス作成みたいな、そうでなければ失われてしまうものはLLMに向いてる気がする。理想的な解決策かどうか、他の検索エンジンの方が良かったのかは別の話だね。

同じことを考えてたけど、メモとスロップを明確に分けることができると思うよ。例えば、すべてのメモをチェックして簡単に勝てるところがあればPRを作るようなcronジョブみたいなもの。最近はこういう風にコーディングしてる:新しい非クリティカルなセクションやユニットテストをレビューするのが面倒なときは、// SLOPってマークしておく。後で必要があれば全体を見直して、クソテストよりはマシだから、期待値を低めに設定しておけば大丈夫。

製品名にAIを入れれば、億万長者になれる。ブログ記事にKarpathyを入れれば、Anthropicに主任エンジニアとして雇われる。流行が続く限りお金を搾り取る。誰も顧客のニーズを考えてないし、みんな波に乗ろうとしてるだけ。

Hacker Newsで議論の続きを見る