ハクソク

世界を動かす技術を、日本語で。

サカナフグ

2026年6月22日原文(sakana.ai)

概要

Sakana Fugu は、複数の強力なAIモデルを動的に統合・協調し、マルチステップの複雑なタスクを自動解決するAPI
単一ベンダー依存を排除 し、最先端のパフォーマンスと柔軟性を両立
エージェント選択やプライバシー要件 にも対応し、ワークフローへの直接組み込みが可能
ICLR 2026論文 に基づく最新の協調技術を採用
EU/EEAではGDPR対応中 のため未提供

Sakana Fugu：マルチエージェント統合AIモデル

世界トップクラスの多様なAIモデル を動的に組み合わせて協調
人間が設計しない最適なエージェント編成 や役割分担を自動で学習
APIひとつで複数モデルを最適活用 し、モデル選択・切り替えも自動
コストパフォーマンスとAPI運用の簡素化 を両立
コーディング・推論など高品質ワークフロー 向けに設計
エージェント選択の柔軟性 があり、特定プロバイダーやモデルの除外も可能
- データ・プライバシー・コンプライアンス要件 への対応
ICLR 2026論文「TRINITY」「Conductor」 で裏付けられた協調技術
- 手設計ワークフロー不要、システム自身が最適な協調戦略を学習

技術概要：TRINITY & Conductor

TRINITY ：進化型LLMコーディネーター
- Thinker（思考）・Worker（実行）・Verifier（検証） の役割を割り当て
- 複数ターンにわたりLLMを統括 し、タスクに応じた最適な役割分担
Conductor ：自然言語によるエージェント協調学習
- 強化学習で自然言語ベースの協調戦略を発見
- エージェント間の通信パターンや要点プロンプトを自動設計
- 多様なLLMプールが単体モデルを上回る性能 を実現

利用方法：APIによるマルチエージェント知能の解放

Fugu と Fugu Ultra の2モデルを OpenAI互換API で提供
- 用途や負荷に応じてモデル選択・切り替えが容易
Fugu ：バランス型（高性能＆低レイテンシ）
- 日常業務・コーディング・チャットボット に最適
- エージェントプールのカスタマイズ も可能
Fugu Ultra ：高難度タスク向け高性能型
- Kaggle・論文再現・セキュリティ分析・特許調査 で活用
- より広範な専門エージェントを統合 し、回答品質を最大化

定量評価：Fuguモデルのベンチマーク

Fugu/Fugu Ultraは公開フロンティアモデルを上回る性能
Fable 5やMythos Previewと同等レベル の難関ベンチマーク結果
輸出規制リスクなしで最先端能力 を提供
最高スコアは太字、2番目は下線 で表示
- SWE Bench Pro、TerminalBench、LiveCodeBench等で高得点
- Fugu Ultraは難度の高い推論・長文文脈処理でも優位

定性評価：実例によるFuguの優位性

例1：AutoResearch（LLM学習自動化）
- Fugu-Ultraが最も低いBPB（bits-per-byte）を達成
- バッチサイズ・学習率・モデル深度等の自律的最適化
- 複数モデル協調が単体フロンティアモデルを上回る実証
例2：仮名消息（古典日本語書状）の読み順推定
- Fugu-UltraがNED 0.80の高スコア
- 他のモデル（A/B）は0.24以下、Cは出力不能
- 読み順の可視化で圧倒的な精度
例3：ルービックキューブソルバー自動生成
- Fugu-UltraとModel Aのみが全300問を正解
- Fugu-Ultraは平均手数でModel Aを僅差で上回る
- Model B/Cはコードが動作せず0問正解

まとめ：Sakana Fuguの特長と導入メリット

単一APIで世界最高峰のAIモデル群を動的協調
複雑・高難度なタスクにも安定・高品質な回答
エージェント選択やプライバシー配慮など柔軟な運用
最新研究に基づく協調技術で、単体モデルを凌駕
API連携で既存ワークフローへの即時導入が可能
EU/EEAではGDPR等対応後に提供予定

Hackerたちの意見

フロンティアレベルのパフォーマンスを、単一ベンダーに依存せずに実現。[...] 今日は、単一のAPIを使って、集団知能を直接ワークフローに組み込もう。複数のベンダーがこの「単一API」を運営しているのか、それともこれが単一ベンダー依存を別の単一ベンダー依存に置き換えることにならないの？

正直、sakana.aiがもっとクールなことをやっていると思ってた。でも、こういう製品が出るのは自然な流れだね。LLMを使うには、少なくとも2つ持っておくのがベストだと思う。モデル同士が互いの弱点を補完し合うから。固定費のサブスクリプションプランで提供しているのも面白いね。第一者のプロバイダーは、API推論のマージンが80%くらいだから、これができる印象がある。他のモデルの上でオーケストレーションしている人たちは、これらのコストを負担するか、自分たちで飲み込む必要がある。

Anthropicに月200ドル、OpenAIに月200ドル、Cursorに月200ドル、Googleに月200ドル払って、合計がちょうど1024ドルにならないから、Sakanaに月200ドル払って全部調整してもらうって感じ。ついでに、私にも200ドル送ってくれたら、"AI"で終わる暗号アドレスを生成するよ。

└

今日学んだこと: base58ではI（大文字のアイ）、l（小文字のエル）、O（大文字のオー）、0（ゼロ）が使えないことを知ったから、GrxoJt4eNXE2QaQ55iPSa7hhiYdzCo8ZeAuokmh2Caiしか生成できなかった。（何も送らないで、これは知らなかったbase58の豆知識を共有したかっただけ）

└

ローカルモデルを動かすのに0ドル、またはAPI経由で安価なDeepSeek V4モデルを使うのもほぼ無料に近い。これから価格はどんどん0ドルに向かって競争するだろうね。

└

ここでハッピーなユーザーです。Composer 2.5と組み合わせて、Fugu Ultraをアドバイザー、Fugurをプランナーにして使ってる。スコープやアーキテクチャは、便利なFableスタイルのオーケストレーションと同等で、一つのチャットスレッドよりも良い感じ。oh-my-piの/advisorでFugu Ultraを使って、archive.twでプロダクションを出してる。ドライバーが速ければ、アドバイザーがループを遅くすることはないよ。アドバイザーをワーカーから分けられるハーネスがあれば、価値があると思う。

└

オープンルーターを使って、使いたいモデルに切り替えればいいんじゃないかな…（そう思う）

└

今のところ、Neuralwattを試してみて、GLM5.2でどれくらいリクエストができるか見てみようかな。Neuralwattクラウドを使うのはすごく安いっていうレビューをたくさん読んだし。

└

これ、機能するの？経済的なことよりもMVPとのフィット感に興味があるんだけど。

└

よ、友よ、エージェントが好きだって聞いたから、エージェントの中にエージェントを入れたぜ。トークンを燃やしながら、トークンを燃やせるようにしたんだ。

└

Anthropicに月$200しか払ってなかったらよかったのに！それを20倍にしてみて。

└

現在のセットアップ：月$20：Claude Code、月$10：Minimax、月$16：Xiaomi Mimo、月$10：Opencode。低/中程度の労力でOpusがプランを生成する。そこから、いくつかのコーディネーター/ワーカーのペアが可能だ：DeepSeek v4 Pro + Minimax M3、Mimo v2.5 Pro + Mimo v2.5、Mimo + Minimax、Sonnet 4.6 + Haiku。何百もの長いマルチエージェントセッションを実行して、ここでちょっとクレジットを追加したけど、まだ月$200の支出には達してない。今は完全にClaude/Codexに頼るのはお金の無駄に感じるね。

Hacker Newsで議論の続きを見る