AI OSSツールのリポジトリが730万ドルのシード資金調達後、 overnight でアーカイブされる

2026年6月13日原文(github.com)

概要

TensorZero はオープンソースの LLMOpsプラットフォーム
統一APIによるマルチLLM接続、超低遅延ゲートウェイ
観測性・評価・最適化・実験機能を統合
OpenAI SDKやOpenTelemetryなど主要ツールと高い互換性
Fortune 10企業含む幅広い導入実績、世界のLLM API利用の約1%を支援

TensorZeroの特徴と機能

LLM Gateway
- 1つの統一APIで主要なLLMプロバイダー全てへアクセス
- APIまたはセルフホスト型LLMの呼び出し対応
- ツール利用、構造化出力(JSON)、バッチ、埋め込み、マルチモーダル(画像・ファイル)、キャッシュなど多彩な推論
- プロンプトテンプレートやスキーマでアプリとLLM間のインターフェースを明確化
- Rust による高性能設計：10,000QPS超でも<1ms p99遅延
- ルーティング、リトライ、フォールバック、ロードバランシング、細かなタイムアウトで高可用性
- 利用量・コスト管理、タグ単位のレート制限
- APIキー非共有での認証設定
- Anthropic、AWS Bedrock、Azure、OpenAI、Mistral、xAIなど幅広いモデル対応
- OpenAI互換API(Ollama等)もサポート
LLM Observability（観測性）
- API呼び出し単位のデバッグや、モデル・プロンプト横断のメトリクス監視
- 推論結果やフィードバック（メトリクス・人手修正等）を自社DBに保存
- TensorZero UIやAPIで個別/集計データを分析
- データセット構築や過去推論の再実行が可能
- OpenTelemetryトレースやPrometheusメトリクスの外部連携
- 近日：AI支援デバッグ・データラベリング
LLM Optimization（最適化）
- 本番メトリクスや人手フィードバックを活用し、UIまたはAPI経由でプロンプト・モデル・推論戦略を最適化
- モデルの教師ありファインチューニングやRLHF等もサポート
- GEPA等の自動プロンプトエンジニアリングアルゴリズム
- 動的in-context learningやbest/mixture-of-Nサンプリング
- 本番データを賢く・速く・安くする学習サイクル
- 近日：合成データ生成
LLM Evaluation（評価）
- ヒューリスティックやLLMジャッジによる推論・ワークフロー評価
- 個別推論の評価（LLMのユニットテスト相当）
- ワークフロー全体の評価（LLMの統合テスト相当）
- LLMジャッジ自体も最適化可能
- CLIやUIからの柔軟な評価実行
- 近日：組み込み評価器追加・ヘッドレス評価
LLM Experimentation（実験）
- 組み込みA/Bテスト、ルーティング、フォールバック、リトライ等で安心して本番投入
- 適応型A/Bテストで最適プロンプト・モデルを特定
- 複雑なワークフロー（マルチターンLLM、逐次テスト等）にも対応
- GitOps対応の大規模展開やプロトタイピングも容易
- プログラム主体の拡張、DB直アクセス、サードパーティ連携も可能
- Playground UIで対話的にプロンプト実験

TensorZero Autopilot

TensorZero Autopilot
- TensorZero上で動作する自動AIエンジニア
- LLM観測データの分析、評価セットアップ、プロンプト・モデル最適化、A/Bテスト自動実行
- 多様なタスクでLLMエージェントの性能を大幅向上

導入・利用方法

OpenAI SDKや互換クライアント（Python, Node, Go等）対応

TensorZero GatewayをDockerでデプロイ
base_urlとmodelをTensorZero用に設定

例：

from openai import OpenAI
client = OpenAI(base_url="http://localhost:3000/openai/v1", api_key="not-used")
response = client.chat.completions.create(
  model="tensorzero::model_name::anthropic::claude-sonnet-4-6",
  messages=[{"role": "user", "content": "Share a fun fact about TensorZero."}]
)

詳細はQuick Start参照

よくある質問（FAQ）

他のLLMフレームワークとの違い
- 本番メトリクス・人手フィードバックに基づくLLMアプリ最適化
- 低遅延・高スループット・型安全・セルフホスト・カスタマイズ性
- LLMOpsスタック統合による複利的メリット
- 例：LLM評価とファインチューニングの連携
主要言語・ツールとの互換性
- 全主要プログラミング言語対応
- OpenAI SDK、OpenTelemetry、主要LLMプロバイダーと高い親和性
プロダクション対応状況
- Fortune 10含む企業で本番利用
- 世界のLLM API利用の約1%を支援
コスト
- TensorZero本体は100%セルフホスト・オープンソース
- Autopilotは有料アドオン
開発チーム
- 元Rustコンパイラメンテナ、著名ML研究者（Stanford, CMU, Oxford, Columbia）、デカコーンCPO等で構成
- ClickHouse、CockroachDB、OpenAI、Anthropic等と同じ投資家が支援
- $7.3Mシードラウンド調達済み、VentureBeat等で紹介
- NYCで採用中
導入手順
- 段階的導入が可能
- Quick Startで5分以内に本番対応LLMアプリを構築
- SlackやDiscordで質問受付
- チーム導入時はhello@tensorzero.comまで連絡で専用チャネル作成可能（無料）

代表的なユースケース例

データ抽出(NER)パイプライン最適化
- ファインチューニングや動的in-context learningでGPT-4o Miniを最適化
- 少量データでコスト・遅延を大幅削減しつつ精度向上
Agentic RAG（マルチホップQA）
- Wikipediaを逐次検索し、複雑な質問に段階的に回答するエージェント構築
嗜好に合わせた俳句生成
- GPT-4o Miniを特定ジャッジの嗜好に合わせてファインチューニング
- データフライホイールによる継続的な性能向上
画像データ抽出（マルチモーダルファインチューニング）
- VLM（GPT-4o等）で論文画像のカテゴリ分類システム構築
LLMチェス能力向上（Best-of-Nサンプリング）
- 複数手を生成し最良手を選択することでチェス性能を大幅強化

参考ブログ記事

Bandits in your LLM Gateway ：適応型A/BテストでLLMアプリを迅速改善
Is OpenAI's Reinforcement Fine-Tuning (RFT) Worth It?
Distillation with Programmatic Data Curation ：5-30倍安価な推論を実現する賢いLLM
From NER to Agents ：自動プロンプトエンジニアリングの複雑タスクへの拡張性

まとめ

TensorZero はLLMOpsの全機能を統合し、 観測性・評価・最適化・実験 をオープンソースで提供
セルフホスト型・高性能・高拡張性 で、プロトタイプから大規模本番運用まで幅広く対応
主要LLM・ツールとの互換性 が高く、段階的な導入や他ツールとの併用も容易
導入・運用サポート体制 も充実、コミュニティ・エンタープライズ両対応

Hackerたちの意見

ほとんどのVCはアプリケーション層を避けてるよね。リスクが高すぎて、アプリケーション層の勝者が出るのは難しいって思ってるみたい。彼らはそれをGPTラッパー（今はHarnessって呼ばれてる）って呼んで、インフラ層にお金を注いでる。今後この考えがどうなるか、あなたの意見を聞きたいな。

└

僕の経験とは違うな。ほとんどのVCの考えはアプリケーション層に集中してると思う。インフラについてはあまり考えてないんじゃないかな。とはいえ、偏見があるけど、インフラ周りにはたくさんの仕事があるから、「ただのラッパー」って呼ぶのは努力を大きく過小評価してると思う。これは自分の経験から言ってるんだけど。それに、もし本当なら、OpenClawがオープンソースプロジェクトにこんなにお金を使ってるのはどういうこと？給料だけでも7桁の費用がかかるし、まさにこのことをやってる会社と関わったことがあるからね。ちょっと宣伝になっちゃうけど、僕たちはcbk.aiを作ってる、今はchatbotkit.comとして知られてるよ。

僕みたいに、イベントのタイミングが分からなかった人には、2025年8月に資金調達して、昨日通知もなくアーカイブされたって感じ。

タイトルはシードラウンドをやったみたいに聞こえるけど、シードラウンドは去年の8月に発表されたんだよね。[0] それに、彼らのウェブサイトのランディングページも、ソフトウェアがもはやメンテナンスされていないって表示してる。なぜこの決定をしたのかは触れられてないけど、僕の予想ではシードマネーを使い果たして、さらなる投資を引き寄せられなかったんじゃないかな。[0]: https://www.tensorzero.com/blog/tensorzero-raises-7-3m-seed-...

└

このプロジェクトは資金調達のためだけに作られたんじゃないかな。餌みたいなもので、それが終わったらもう終わり。

└

9ヶ月で700万ドル使い切るって？アボカドトーストにしてはすごい金額だね。

└

会社は2024年1月に設立されたから、シード資金調達は2年間の資金調達をまとめたものだろうね。ニューヨークでAIスタートアップを運営するのに700万ドルはそんなに珍しくないよ。

シードは2025年8月で、ウェブサイトにはプロジェクトがもはやメンテナンスされないって書いてあるよ: https://www.tensorzero.com/

└

明らかにアップグレードして、ダッシュを買って、https://www.tensor-one.com/ に移ったんだね。

└

実はシードは'24年にあったんだけど、発表したのは'25年になってからです。

VCは「アプリはリスクが高い、インフラは安全だ」って思ってるから、AIインフラに投資したんだよね。「インフラは安全」って、うーん、それは良い考えじゃなかったね。もしTensorZeroみたいなオープンソースのインフラプロジェクトがこんなに早く閉鎖されたら、彼らはその投資理論もリスクがあるって気づくんじゃないかな。AIインフラの難しいところは、他の業界と違って、分散しないってこと。特定の大手テックモデルに結びついたまま残る可能性が高いんだ。これってどういう意味かっていうと、AIモデルがまだ標準化されてないから、インフラ自体が実はリスクが高いってこと。つまり、基準の民営化が進んでるんだよね。AIインフラの課題は、データベースやウェブサーバー、クラウド、コンテナなどの他のソフトウェアインフラ市場とは違って、独立した安定した標準層が形成されていないこと。時間が経つにつれて、そういうエコシステムは比較的標準化されたインターフェースや運用層を発展させてきたけど、LLMエコシステムはまだ急速に進化してる。モデル自体がすぐに変わるし、APIも違う、価格も違う、コンテキストウィンドウ、ツール呼び出し、構造化出力、評価、ファインチューニング、キャッシング、ルーティング、すべてが変わり続けてる。だから、インフラスタートアップが複数のモデルに跨る共通の抽象層を構築しようとしても、その共通層が安定する前に、OpenAIやAnthropic、Google、AWS、Azureみたいな大手モデルやクラウドプロバイダーが同じ機能を直接吸収しちゃうんだ。結局、AIインフラは独立した層として確立されるのではなく、モデルプロバイダーの付属機能になりかねない。だけど、730万ドル調達したスタートアップがこんなに早く失敗するなら、誰がそんなものを信じて投資するんだろう？それはさておき、最近はAIスタートアップが流行ってるみたいだね。僕もAIを学んで、そんな風に資金調達したいな。誰かここで僕を信じて投資してくれる人いる？

└

インフラはある程度安全かもしれないけど、現実的には長期的には本当に低マージンで資本集約型のビジネスだよ。AWSみたいに何百ものサービスで顧客をロックインできない限り、大きなROIを得るのは難しい。最近の資金調達はかなり集中してるし、2020-21年に比べると全体的におとなしい感じだね。

Hacker Newsで議論の続きを見る

ハクソク