Uberの月額1,500ドルのAI制限はAIツールの価格設定にとって有益なシグナルである

2026年6月3日原文(simonwillison.net)

概要

UberがAIコーディングツールの利用費用を 月額$1,500 に制限コスト管理のため 従業員ごと ・ ツールごと の上限設定対象はCursorやClaude Codeなど エージェント型AI 年間AI予算がエンジニア報酬の 約11% に相当個人利用と比べ 企業向けプランの違い も明確化

Uber、AIコーディングツール利用に上限設定

Uberが AIコーディングツール の利用コスト急増を受けて 月額上限 を導入
各従業員ごと、各ツールごとに 月$1,500 までのトークン利用制限
複数ツール利用時でも ツールごと に予算が独立
制限対象は Cursor や Anthropic Claude Code など エージェント型AIツール
一部ツールの 過度な利用競争 を防止する狙い
制度導入前は AI予算超過 が頻発し、コスト管理の必要性が高まっていた状況

利用上限の実際の影響

エンジニア1人あたり 年間$36,000 のAI利用上限（2ツール利用を想定）
Uberエンジニアの 中央値年収$330,000 （Levels.fyi調べ）に対し、 約11% がAI利用費上限
個人利用者向けプランは 月$100 程度で同等のトークンが利用可能
- Uberのような大企業は 個人向け割引が適用外
筆者の利用例では 現行利用量でも上限未満 のため、通常業務には十分な設定
AI利用効率 と コスト最適化 のバランスを重視したポリシー

企業におけるAIツール利用管理の示唆

AIツールの急速な普及 による予算超過リスクの顕在化
従業員ごと・ツールごと の上限設定による公平性と管理性の両立
AI導入効果 の費用対効果を定量的に把握可能に
今後、他社でも 同様の利用制限ポリシー 導入が進む可能性

Hackerたちの意見

月1500ドルって、年で18,000ドル/席だよね。もしかしたら、MicrosoftとNvidiaは何かいいことに気づいてるかも。128GBのマシンでローカルのLLMが動かせるなら、5〜8千ドルでもお得だと思う。確かにトークン/秒はまだまだだけど、実際のボトルネックはコードじゃなくて、「Uberはあの支出で何を作ったの？」ってことだよね。それが収益にどう影響したのか、ポジティブな方向に。

└

彼らの規模なら、大規模なオンプレミスかレンタル（基本的にはまだクラウドだけど、安い）GPUクラスターを運用して、それを使うこともできるよ。固定費がかかるけど、必要なら最先端モデルの重みをライセンスすることもできるし。

└

「Uberはあの支出で何を作ったの？」ってことだよね。アメリカのUberエンジニアリングの中央値330kドルの給料についても同じことが言えるよ…ちょっと皮肉っぽく言うと、いくつかのカンファレンスでUberのエンジニアの話を聞いてると、彼らは内部ツールやプラットフォームを（再）発明するのが好きみたい。これ自体が結構高くつくよ。追記：Uberのエンジニアが会社に価値を加えなかったとは言ってないよ。彼らは確かに価値を加えたし、彼らが扱ったスケールを管理するのは簡単なことじゃない。でも、「彼らはその（LLM）支出でどんな機能を作ったの？」っていうGPの考えには疑問を呈したい。

└

基本的なポイントには同意するけど、月1500ドル分の最先端ローカルAIを運用するのは簡単じゃないし、それは一席分の数字だからね。実際、24時間365日で少なくとも20トークン/秒を生成するのと同じくらいのことだし、実際にはそれ以上かもしれない（オープンウェイトモデルは、信頼できる西洋のプロバイダーから提供されていても、プロプライエタリなものよりもずっと安いから - 同じ支出に達するには、100トークン/秒以上が必要になる）。プロシューマープラットフォームでその数字に達することはできるかもしれないけど、特別なワークロードに限られるよ。エージェント的なワークロードでは、プレフィルに多くの時間をかけることが一般的だから、見通しはさらに悪くなる。これはオンプレミスAIにとって大きな制約だから。

└

企業は最終的にはローカルAIサーバーを購入するようになると思う。複雑なソフトウェアスタックを動かすのにローカルハードウェアは高くつくし、10,000通りの方法で壊れる可能性があるからね。最終的なローカルAIサーバーは、AI用のプロトコルを話して隅に置かれるだけで、誰も気にしなくなるんじゃないかな。いろんなシステムへのアクセスが必要かもしれないけど、どうだろう。最終的には「箱入りAI」を提供する人が現れると思うけど、最新のオープンモデルを動かすような感じで。

└

トークン/秒がボトルネックじゃないってどういうこと？ほとんどの人は、夜中に放置するんじゃなくて、インタラクティブにAIエージェントを使ってると思うんだけど。50トランザクション/秒以下は全く使えないと思うし… それに、オープンウェイトモデルの推論はかなり安いけど、ClaudeやOpenAIはDeepSeekやOpenRouterのいろんなプロバイダーと比べて高いマージンを取れるってことだよね。

└

企業が高価な主要ラボのモデルから離れることを決めたとしても、オープンウェイトモデルをホストするためにクラウドプロバイダーに支払う方が、すべての（内部）ユーザーに分散してコストを amortize できるから、経済的にはずっと良いと思う。みんなにそれぞれハードウェアを持たせるより、ピーク時の使用量や1バッチの推論に備えたプロビジョニングが必要になるからね。

└

自社でオンプレミスのモデルを運用した方が絶対いいよ。ノートパソコンは減価償却資産で、規模の経済の恩恵を受けられないし、固定スペックで、モデルを最新の状態に保つためにフリートが分断されちゃう。電力消費や冷却の問題については言うまでもない。企業がその方向に行く理由が全然わからないな。

└

128GBのマシンじゃ、Claudeみたいなフロンティアモデルに匹敵するようなことはローカルでは動かせないよね。Deepseek v4 proが1.6Tモデルで、動かすのに約860GBのVRAMが必要ってことからもわかる。

└

Uberが作ったものとは必ずしも思わないけど、得られる生産性が大事だよね。エンジニアがAIツールを正しく使えば、生産性が劇的に向上するし、それによってLLMをジュニアやアソシエイトエンジニアとして使えるようになる。月1500ドルでそのレベルの生産性を得られるなら、人間のエンジニアにもっとお金を払う必要があっただろうから、すごく安いよね。

1500ドルって数字よりも、彼らが上限に達したって事実の方が興味深い。話したエンジニアリングチームのほとんどは、開発者一人あたりのAI支出がいくらか全然わからない。だって、統合されたクラウド請求書の中に埋もれてるから。ハードキャップがあると、API呼び出しとローカル推論のどのワークフローが実際に正当化されるか、そしてその出力が本当に生産性の指標に対して測定されているかっていう、2つの有益な会話を強制するんだよね。フィードバックループがなければ、ただ誰がトークンを早く消費できるかのレースになっちゃう。

└

AnthropicとOpenAIの「エンタープライズ」プランには、開発者ごとの分析が含まれてるよ：Anthropic: https://support.claude.com/en/articles/12883420-view-usage-a... OpenAI: https://help.openai.com/en/articles/10875114-workspace-analy...

Hacker Newsで議論の続きを見る

ハクソク

Uberの月額1,500ドルのAI制限はAIツールの価格設定にとって有益なシグナルである

概要

Uber、AIコーディングツール利用に上限設定

利用上限の実際の影響

企業におけるAIツール利用管理の示唆

Hackerたちの意見