世界を動かす技術を、日本語で。

サカナ フグ

2026年6月22日原文(sakana.ai)

概要

  • Sakana Fugu は、複数の強力なAIモデルを動的に統合・協調し、マルチステップの複雑なタスクを自動解決するAPI
  • 単一ベンダー依存を排除 し、最先端のパフォーマンスと柔軟性を両立
  • エージェント選択やプライバシー要件 にも対応し、ワークフローへの直接組み込みが可能
  • ICLR 2026論文 に基づく最新の協調技術を採用
  • EU/EEAではGDPR対応中 のため未提供

Sakana Fugu:マルチエージェント統合AIモデル

  • 世界トップクラスの多様なAIモデル を動的に組み合わせて協調
  • 人間が設計しない最適なエージェント編成 や役割分担を自動で学習
  • APIひとつで複数モデルを最適活用 し、モデル選択・切り替えも自動
  • コストパフォーマンスとAPI運用の簡素化 を両立
  • コーディング・推論など高品質ワークフロー 向けに設計
  • エージェント選択の柔軟性 があり、特定プロバイダーやモデルの除外も可能
    • データ・プライバシー・コンプライアンス要件 への対応
  • ICLR 2026論文「TRINITY」「Conductor」 で裏付けられた協調技術
    • 手設計ワークフロー不要、システム自身が最適な協調戦略を学習

技術概要:TRINITY & Conductor

  • TRINITY :進化型LLMコーディネーター
    • Thinker(思考)・Worker(実行)・Verifier(検証) の役割を割り当て
    • 複数ターンにわたりLLMを統括 し、タスクに応じた最適な役割分担
  • Conductor :自然言語によるエージェント協調学習
    • 強化学習で自然言語ベースの協調戦略を発見
    • エージェント間の通信パターンや要点プロンプトを自動設計
    • 多様なLLMプールが単体モデルを上回る性能 を実現

利用方法:APIによるマルチエージェント知能の解放

  • FuguFugu Ultra の2モデルを OpenAI互換API で提供
    • 用途や負荷に応じてモデル選択・切り替えが容易
  • Fugu :バランス型(高性能&低レイテンシ)
    • 日常業務・コーディング・チャットボット に最適
    • エージェントプールのカスタマイズ も可能
  • Fugu Ultra :高難度タスク向け高性能型
    • Kaggle・論文再現・セキュリティ分析・特許調査 で活用
    • より広範な専門エージェントを統合 し、回答品質を最大化

定量評価:Fuguモデルのベンチマーク

  • Fugu/Fugu Ultraは公開フロンティアモデルを上回る性能
  • Fable 5やMythos Previewと同等レベル の難関ベンチマーク結果
  • 輸出規制リスクなしで最先端能力 を提供
  • 最高スコアは太字、2番目は下線 で表示
    • SWE Bench Pro、TerminalBench、LiveCodeBench等で高得点
    • Fugu Ultraは難度の高い推論・長文文脈処理でも優位

定性評価:実例によるFuguの優位性

  • 例1:AutoResearch(LLM学習自動化)
    • Fugu-Ultraが最も低いBPB(bits-per-byte)を達成
    • バッチサイズ・学習率・モデル深度等の自律的最適化
    • 複数モデル協調が単体フロンティアモデルを上回る実証
  • 例2:仮名消息(古典日本語書状)の読み順推定
    • Fugu-UltraがNED 0.80の高スコア
    • 他のモデル(A/B)は0.24以下、Cは出力不能
    • 読み順の可視化で圧倒的な精度
  • 例3:ルービックキューブソルバー自動生成
    • Fugu-UltraとModel Aのみが全300問を正解
    • Fugu-Ultraは平均手数でModel Aを僅差で上回る
    • Model B/Cはコードが動作せず0問正解

まとめ:Sakana Fuguの特長と導入メリット

  • 単一APIで世界最高峰のAIモデル群を動的協調
  • 複雑・高難度なタスクにも安定・高品質な回答
  • エージェント選択やプライバシー配慮など柔軟な運用
  • 最新研究に基づく協調技術で、単体モデルを凌駕
  • API連携で既存ワークフローへの即時導入が可能
  • EU/EEAではGDPR等対応後に提供予定

Hackerたちの意見

フロンティアレベルのパフォーマンスを、単一ベンダーに依存せずに実現。[...] 今日は、単一のAPIを使って、集団知能を直接ワークフローに組み込もう。複数のベンダーがこの「単一API」を運営しているのか、それともこれが単一ベンダー依存を別の単一ベンダー依存に置き換えることにならないの?

正直、sakana.aiがもっとクールなことをやっていると思ってた。でも、こういう製品が出るのは自然な流れだね。LLMを使うには、少なくとも2つ持っておくのがベストだと思う。モデル同士が互いの弱点を補完し合うから。固定費のサブスクリプションプランで提供しているのも面白いね。第一者のプロバイダーは、API推論のマージンが80%くらいだから、これができる印象がある。他のモデルの上でオーケストレーションしている人たちは、これらのコストを負担するか、自分たちで飲み込む必要がある。

Anthropicに月200ドル、OpenAIに月200ドル、Cursorに月200ドル、Googleに月200ドル払って、合計がちょうど1024ドルにならないから、Sakanaに月200ドル払って全部調整してもらうって感じ。ついでに、私にも200ドル送ってくれたら、"AI"で終わる暗号アドレスを生成するよ。

今日学んだこと: base58ではI(大文字のアイ)、l(小文字のエル)、O(大文字のオー)、0(ゼロ)が使えないことを知ったから、GrxoJt4eNXE2QaQ55iPSa7hhiYdzCo8ZeAuokmh2Caiしか生成できなかった。(何も送らないで、これは知らなかったbase58の豆知識を共有したかっただけ)

ローカルモデルを動かすのに0ドル、またはAPI経由で安価なDeepSeek V4モデルを使うのもほぼ無料に近い。これから価格はどんどん0ドルに向かって競争するだろうね。

ここでハッピーなユーザーです。Composer 2.5と組み合わせて、Fugu Ultraをアドバイザー、Fugurをプランナーにして使ってる。スコープやアーキテクチャは、便利なFableスタイルのオーケストレーションと同等で、一つのチャットスレッドよりも良い感じ。oh-my-piの/advisorでFugu Ultraを使って、archive.twでプロダクションを出してる。ドライバーが速ければ、アドバイザーがループを遅くすることはないよ。アドバイザーをワーカーから分けられるハーネスがあれば、価値があると思う。

オープンルーターを使って、使いたいモデルに切り替えればいいんじゃないかな…(そう思う)

今のところ、Neuralwattを試してみて、GLM5.2でどれくらいリクエストができるか見てみようかな。Neuralwattクラウドを使うのはすごく安いっていうレビューをたくさん読んだし。

これ、機能するの?経済的なことよりもMVPとのフィット感に興味があるんだけど。

よ、友よ、エージェントが好きだって聞いたから、エージェントの中にエージェントを入れたぜ。トークンを燃やしながら、トークンを燃やせるようにしたんだ。

Anthropicに月$200しか払ってなかったらよかったのに!それを20倍にしてみて。

現在のセットアップ:月$20:Claude Code、月$10:Minimax、月$16:Xiaomi Mimo、月$10:Opencode。低/中程度の労力でOpusがプランを生成する。そこから、いくつかのコーディネーター/ワーカーのペアが可能だ:DeepSeek v4 Pro + Minimax M3、Mimo v2.5 Pro + Mimo v2.5、Mimo + Minimax、Sonnet 4.6 + Haiku。何百もの長いマルチエージェントセッションを実行して、ここでちょっとクレジットを追加したけど、まだ月$200の支出には達してない。今は完全にClaude/Codexに頼るのはお金の無駄に感じるね。

Hacker Newsで議論の続きを見る