世界を動かす技術を、日本語で。

LLMは安価である

概要

  • 生成AIの運用コスト は一般的な認識よりも はるかに安価
  • Web検索API との比較で、 LLM推論コストの低さ を明確化
  • API価格が低い理由 や、 誤解の背景 についても言及
  • AI企業の収益構造今後の課題 を整理
  • 消費者向けAIサービスの将来性 を展望

生成AIの運用コストは実は安い

  • 生成AI(Large Language Models) の運用コストが 高い という誤解が依然として多い現状
  • 初期のAIブーム では推論コストが高額だったが、 近年は劇的なコストダウン
  • 「$ per million tokens」 という価格モデルが直感的に理解しづらいことも誤解の要因
  • Web検索API との比較で、 LLMの推論コスト の安さを示す

Web検索APIとLLMのコスト比較

  • Google Gemini API :「Grounding with Google Search」機能は $35/1,000クエリ
  • Bing Search API :最安値で $15/1,000クエリ
  • Brave :最安値 $5/1,000クエリ、実際の運用価格は $9/1,000クエリ
  • LLMの価格例 (2025年5月2日時点)
    • Gemma 3 27B$0.20/1Mトークン
    • Qwen3 30B A3B$0.30/1Mトークン
    • Gemini 2.0 Flash$0.40/1Mトークン
    • GPT-4.1 nano$0.40/1Mトークン
    • Claude 3.5 Haiku$4.00/1Mトークン
    • Claude 3.7 Sonnet$15.00/1Mトークン
    • o3$40.00/1Mトークン
  • 1クエリあたり1,000トークン と仮定すると、 LLMはWeb検索APIより1桁以上安価 な場合が多い
  • バッチ処理やオフピーク時割引 など、さらに安価に利用できるオプションも存在

よくある反論とその検証

  • 「LLMの応答はもっと長いのでは?」
    • 通常のWeb検索用途では 500~1,000トークン が妥当な範囲
  • 「API価格は赤字覚悟の市場獲得狙い?」
    • 多くのモデルは ユニット単位で利益が出ている と考えられる
    • 第三者ホスティング公開ウェイトモデル も同等の価格帯
    • Deepseek の公開データでは、 GPUコストだけで80%の利益率
  • 「Web検索APIはインデックス構築コストも含むのでは?」
    • インデックス維持コストは存在するが、 人気LLMの推論コストに比べて大きな差はない
  • 「Web検索の方が圧倒的に速いのに、なぜ高い?」
    • 検索は 並列処理 が可能だが、 LLM推論は現状シリアル処理
  • 「OpenAIは赤字だが?」
    • 無料ユーザーの多さ収益化不足 が主因
    • 1ユーザーあたり月$1の収益化 でも十分黒字化可能

コスト構造と今後の展望

  • 推論コストの低下 により、 価格も下落 し需要が拡大
  • 安価なモデルの利用増加 がOpenRouter APIのトラフィックからも確認できる
  • 消費者向けAIサービス も同様のコスト構造、 広告モデル で十分な収益化が可能
  • AI企業の財務状況 は一部の悲観論より健全
  • 本当のコスト課題 は、 AIエージェントが利用する外部バックエンドサービス 側に移行

まとめ

  • 生成AIの運用コストWeb検索APIよりも安価 なケースが多い
  • API価格は実コストを反映 しており、 サステナブルなビジネスモデル
  • 誤解に基づく悲観論 は現実と乖離
  • 今後も推論コストは下がり続け、AIサービスの収益化機会は拡大
  • 本質的な課題AIの外部サービス連携コスト へとシフト

Hackerたちの意見

まだまだだね。数年後には、コアプレイヤーたちが市場での支配を確立して、規制が入る頃には、裏で約束された価格の値上げが見えてくるよ。

それとも、広告を使うだけかもね。どんな質問をしても、返答はクールでさわやかなコカ・コーラのソフトドリンクをおすすめするだろう。あなたのAIコーディングプロジェクトは、自動的にAnthropicのために収益を集める広告を表示するし、あなたのためじゃない。あなたのAIエージェントが送る10通のメールのうち1通は、受取人にGeicoに切り替えることを考えてもらうように促すだろう。チャンスは無限大だね。

利益が出ているAPI(検索)と、市場シェアを獲得するための損失を出している可能性があるAPI(ホステッドLLMクラウドモデル)を比べるのは無理があるよ。補助金を出している証拠はないかもしれないけど、利益が出ている証拠もないんだから。今あるデータポイントを見る限り、企業はAIの支配を獲得するために、収益がまだ伴わないのに信じられないほどの資本支出をしているんだ。成熟度のライフサイクルの異なる2つの製品を比べているし、全体的な使用が減少している10年物の製品で損失を出す理由は全くないよ。MBAに聞いてみればいい(エンジニアはビジネスの視点が嫌いかもしれないけど)。それに、検索クエリはCPUで高いキャッシング率で処理できるけど、LLMの推論は基本的にGPUが必要で、ユーザー間でキャッシュするのが難しいんだ。なぜなら、どのトークンが出力に大きな影響を与えるか分からないからね。

例えば、Perplexityは利益を見せるために、COGSをR&Dに移して会計数字を誤魔化しているって話だよ。詳しくはここを見てね: https://thedeepdive.ca/did-perplexity-fudge-its-numbers/

この記事にリンクされてるDeepSeekのAPIサービスの分析を読んでみて:彼らは500%の利益率を持っていて、同じモデルを提供しているアメリカの企業よりも安いんだ。OpenAIやAnthropicのAPIサービスは、もっと高い利益率を持っている可能性もあるよ。(GPUは一般的に、CPUよりもコスト効率が良くてエネルギー効率も高いから、解決策が両方のアーキテクチャにマッピングされる場合ね。Anthropicは確実に、彼らの24kトークンシステムプロンプトのKVキャッシュをキャッシュしてるし。)

それに、彼らが利益を上げている証拠もないよね。もちろんあるよ。AWSや他のホスティングプロバイダーに行って、推論のためにお金を払ってみて。AWSが他のモデルの使用を無限に補助してくれると思ってるの? > 今日のデータポイントを見る限り、企業はAIの優位性を得るために、収益がまだ出ていないのに、信じられないほどの資本支出をしているよ。そう、資本支出であって、運営費じゃない。推論を運営するコストは運営費だよ。

無料ユーザー向けの広告が出るまで待ってみて。これは絶対に起こるよ。その広告がどれだけ巧妙かによっては、製品やサービスを直接文脈の中で勧める形で、めちゃくちゃ利益を上げる可能性もある。

でも、推論の限界コストがまだわからないんだよね。今のところ、ユーザーは従来のウェブ体験よりもLLMに対してお金を払う意欲があることを示している。一方で、カードは過去3年間で>8倍効率が良くなって、推論エンジンは>10倍効率が良くなっているし、原モデルも少なくとも横ばいか、もっと効率的になっている。次の2年間で推論コストがさらに10-100倍減る可能性が高いよ。

市場シェアを獲得するためのロスリーダーになりそうなAPI(ホスティングされたLLMクラウドモデル)。もうそうは思わないよ。オープンソースモデルをホストしているAPIプロバイダーを見ると、APIコストと推論ハードウェアコストの間にかなり健康的なマージンがあるのがわかるよ(もちろん、これが唯一のコストではないけど)[1]。それに、彼らの独自の推論最適化は考慮に入れていない。OpenAIやAnthropicのようなクローズドモデルAPIプロバイダーについては、彼らのモデルサイズに関するあまり秘密ではない情報をもとに、ある程度の推測ができるよ。私の知る限り、AnthropicはAPIコストと推論ハードウェアコストの間に非常に良いマージンを持っている。 [1]: これは、スケールでそれらのモデルを運用するのにかかるコストを知っていれば、自分で確認できることだよ。市販のソフトウェアを使うとしても、彼らはうまくやっている。

2024年夏にOpenAI APIの収益性を分析した結果、gpt-4クラスのモデルの推論はかなり利益が出ている可能性が高いことがわかったよ。粗利率は約50%(モデルのトレーニングにかかる資本支出は無視して): https://futuresearch.ai/openai-api-profit

いろんなモデルがあって、価格もバラバラだよね(LLM同士の比較も結構難しいし)。この「損失リーダー」の理論に基づくと、全ての企業がコストを下回る価格設定をしていると考えなきゃいけないのかな…? もしそうなら、かなり無茶な主張に思える。今のモデル開発の流れを考えると、これらの企業が次にどう進むのか、ステップ2は何なのか気になるよね。もっと現実的な仮定は、会社の存続を心配しない程度には利益が出ているってことだと思う。すごく高額なモデルを作って、信じられないくらい高いインフラを構築しなきゃいけないのに、明確な次のステップもないまま赤字で運営するのは、全ての企業がインファレンスで利益を出せない価格設定をしているとしたら、かなり変な考え方が必要だよね。

この理論の問題は、クラウドインファレンスプロバイダーの数が膨大で(ほとんどがサードパーティのモデルをホスティングしてる)、もし全ての企業が同じ戦略をとっているとしたら、それはかなり奇妙だってことだよね。そして、彼らがそれを実行するための同じ財政的な余裕を持っているのも不思議。

「市場シェアを獲得するための損失リーダーになりそうなAPI(ホスティングされたLLMクラウドモデル)」みんなこれを繰り返すけど、私は全然納得できない。モデルやサービスプロバイダーをシームレスに切り替えられるサービスが実際にあるし(openrouter)、ロックインが全くないんだよね。「市場シェアを獲得する」ために赤字で売るのは、完全に愚かだし、VCもそれが分かると思う。

OpenAIは2024年に50億ドルの損失を出したらしい。彼らには5億人の月間アクティブユーザーもいる。損益分岐点に達するには、その無料ユーザーから平均で年間10ドル、月に1ドルを収益化すればいい。こんなサービスで1ドルのARPUは悲惨に低いよ。この記事の他の部分とは関係ないけど、この「ただ」はアトラスが空を支える以上に重い役割を果たしてる。ユーザーを0ドルから1ドルにするのは、1ドルから2ドルにするよりも計り知れないほど難しいし、そのアクティブユーザーの大半は、実際の価格を付けた途端に離れていくと思うよ。

10億ドルを稼ぐためには、中国の全員にコーラを売ればいいだけだよ。中国でコーラを配っててすごく人気だから、これでうまくいくと思う。

5億人の月間アクティブユーザーがいるってことは、すでに何人かはお金を払ってるってことだね。彼らから平均で1ドル以上を引き出さないといけないし、全員が月に1ドル払うようにするだけじゃダメだと思う。これって、500万人が今は何も払っていないと仮定するよりも難しいんじゃないかな。

ああ、もっと明確に言うべきだったな。これが同じようなコメントを2回目もらった理由だ。ユーザーを月1ドルのサブスクリプションに変えるなんて言ってるわけじゃない。それは確かに馬鹿げたアイデアだよ。言いたいのは、十分な性能のLLMはすごく安くて、広告で簡単にマネタイズできるってこと。それに、全然近くもない。広告でマネタイズされている同じくらいの規模の消費者向けサービスを持つ他の企業を見ると、ARPUは1ドルよりずっと高い。多くの人が「LLMは高すぎて広告支援なんて無理、サブスクリプションしか選択肢がない」っていうメンタルモデルを持ってるけど、2年前はそうだったかもしれないけど、今はそうじゃないと思う。

500万人のユーザーの中で、すでにお金を払ってるのはごく少数だから、全員がゼロから1になるわけじゃないけど、もっとマネタイズして月10ドルから100ドルにするってことだね。これがあなたが提示したものより簡単か難しいかは不明だけど、どちらも難しいよ。

こういうサービスは、ユーザーが提供するデータの価値がサブスクリプションの価格よりも高いから、赤字で運営されてると思ってた。

ビジネスモデル全体は、推論が小さな建物の物理的なスペースとコストを占める限りしか機能しないかもしれない。個人用コンピュータが建物全体を占めていた時代から数十年後、同じ計算能力を持つ(ポータブルな)「パーソナルコンピュータ」に移行したからね。大手テック(やNSAなど)ではなく、自分の小さな推論ボックスに全てのデータと人生を送るのが待ちきれないよ。

簡単だよ。OpenAIが損益分岐点を超えるためにやるべきことは、メモを取って、20年以上運営されているGoogleの数兆ドルの広告エンジンとネットワークを再現することだけだよ。

同意。500万人の有料ユーザーがいると、使用状況が劇的に変わってコストも上がるだろうね。1%のユーザーを変換するのが理想的だけど、それでも年間1000ドルになる。

$1の収益化は$1のサブスクリプションを意味しない。広告やアフィリエイトリンク、トラフィック契約を意味するんだ。

これは記事の他の部分から逸脱しているけど、この「ただ」はアトラスが空を支えているよりもずっと重い役割を果たしているよ。ユーザーを$0から$1にするのは、$1から$2にするよりも計り知れないほど難しいし、実際の金額にリアルな価格を付けた瞬間に、ほとんどのアクティブユーザーは離れていくと思う。確かに難しいけど、全員に払わせる必要はなくて、無料ユーザーを効果的に補助するために十分な人が払えばいいんだ。

LLMは、気候への影響やそれに伴うコストを考えると安くないよ。

大規模言語モデルが気候に直接影響を与えるとは思わなかった。

これがまだ真実かどうか理解したいな。

まず言っておくけど、気候変動や炭素の使用にはすごく関心があるんだ。AIの使用は大きな問題じゃなくて、実際には私たちが注力すべきところから目をそらす要因だと思う。https://www.sustainabilitybynumbers.com/p/carbon-footprint-c...

テレビを見るのは、気候への影響やそれに伴うコストを考えると、安くないよね。

一部の経験的データだけど、最近、社内ユーザーからのリクエストのバースト期間中の電力使用を見て、$WORKでLLMを運用するコストを推定したら、トークンあたり数十ドルのオーダーだったよ。うちは大きな会社じゃないし、サーバーも最大負荷ではなかったから、スケールでコストがもっと低くなる可能性があると思う。

これは電力使用量だけなの?

この比較は、検索エンジンとLLM(大規模言語モデル)で「アメリカの首都はどこ?」みたいな簡単な事実検索をする人に依存してるんだよね。これって、両方のAPIの標準的な使い方からかなり外れてるから、全然意味がないと思う。 - 検索エンジンを使うときは、ウェブを検索したいんだ。確かに最近は、単なる検索結果じゃなくて答えを提供することが増えてるけど、それはUIやプロダクトの機能であってAPIの話じゃない。もしGoogleにお金を払ってインデックスにアクセスしてるなら、インデックスに興味があるんだよ。 - LLMを使う理由は、大量の入力データを解析したり、画像認識、複雑な分析、深い思考や推論、コーディングのためなんだ。これらは「あなたの質問の答えはxyzです」っていう2行のレスポンスよりも、はるかに多くのトークンを使うことになる。著者は基本的に「ホンダシビックは安い、だってハニークリスプのリンゴと同じくらいの値段だから」って言ってるようなもんだね。

anecdotalに言うと、私は有料ユーザーで、すごく基本的なクエリをたくさん使ってる。これってバグ? HOAにメールに書き直して、私をノームに変えて、西バージニアが最悪の州なのはなぜ? もしどこかのプロバイダーがファミリープランを売って、子供たちが有料アクセスを得たら、これが10倍に増えると思う。私の重い作業はほとんど仕事関連で、雇用主のポケットを通ってるし。

問題は、従来の検索エンジンモデルがますます役に立たなくなってることだと思う。検索エンジンを使う専門家が減ってきてるし、普通の人は検索エンジンをインデックス検索としてではなく、人間のように扱ってる。古いスタイルの検索エンジンに「アメリカの首都は何ですか?」って聞くのは、実はちょっと違うんだよね。「何ですか」が多分余計で、答えが載ってる教育的なウェブサイトを見つけることを期待してるんだ。実際、「アメリカの首都は」と言った方が検索エンジンには合ってると思う。そういう文が知りたい情報を含んでるからね。それに「SEO」のせいで、関係ないサイトがGoogleに自分のサイトが関連性があると納得させようとするサイトが山ほどある。だから、LLMはますます、実際に関連するキーワードを含まない非公式なクエリに対して重要になってきてるし、無駄な言葉やスパム、広告、購読のリクエストをバイパスできるから、すごく役立つんだよね。

「LLMを使うなら、大量のデータを解析したり、画像認識、複雑な分析、深い思考/推論、コーディングのためだよ。これらは、2行の「あなたの質問の答えはxyzです」っていう返事よりも、ずっとトークンを使うことになる。」確かに、その通りだけど、あなたは普通のユーザーじゃないよね。パワーユーザーだ。

「全ての比較は人々が単純な事実検索しかしないことに依存している」確かにその点はあるけど、そうじゃないよ。記事でも少し触れてるけど、Open AIは2024年の使用量に対してかなり低い損失を出してた。50億は多いように見えるけど、chatgpt.comだけでも2024年には毎月地球上で最も訪問されたサイトの一つで、その訪問者の大半は完全に無料のユーザー(広告なし)だったんだ。昨年の12月にOpen AIはchatgptが1日あたり10億メッセージを超えてるって言ってたし、サービス全体で人々が何をしてるかを見ると、推論はそんなにコストがかかるようには思えない。

比較は文字通り、両方のメカニズムを使って答えを求めることに基づいてる。そして、単純な真実は、膨大な割合のユーザーにとって、まさにそれが検索エンジンとLLMの使い方なんだ。質問の答えが欲しいし、もしそれが満足できなければ、さらに深く掘り下げるためのリンクも欲しい。だからこそ、GoogleはAIの「答え」を追加し始めたんだ。ウェブはちょっとがんになってるみたいで、SEOをうまく利用するサイトは、最もユーザーに優しくない行動をしてるから、検索がほとんどの人にとって不快になっちゃった。だからGoogleは概念的にアウトバウンド訪問を置き換えたんだ。

この比較は、人々が単純な事実検索しかしていないことに依存しているんだよね…検索エンジンとLLMの両方で。私はそうは思わないけど、そう言う人がいる理由はわかる。記事の著者がこう書いているからね。> だから、LLMをウェブ検索と比較してみよう。検索は同じ領域にあって、誰もが使っていて、誰もお金を払っていないから比較対象として選んだんだ。無根拠な生成AIが検索の良い代替になるとは言ってないよ。とはいえ、「LLM APIは補助されているのか?」という記事の分析は、検索エンジンとの比較に依存していない。基本的な分析はシンプルで、単位あたりの{価格対コスト}を比較することだよ。目的は、単位あたりの限界利益/損失を見つけること。LLMの場合、単位はしばしばトークンかAPIコールだよ。要するに、検索エンジンのコストとの比較は、LLM APIが補助されているかどうかを評価するためには必要ないんだ。

「検索エンジンを使っているときは、ウェブを検索したい」確かに、これらのエンジンは検索結果だけでなく答えを提供するようになってきているけど、それはAPIの機能じゃなくてUI/プロダクトの機能だよね。これはいいポイントだ、覚えておこう。 >「LLMを使っているときは、大量の入力データの解析、画像認識、複雑な分析、深い思考/推論、コーディングのためだ」強く反対。グーグルで検索するとき、どのリンクが自分が探している情報を持っているのか明確じゃないことがあるし、もちろん、検索する前にはそれがどうなるか分からないよね。まず、LLMを使えば検索結果の無駄を減らせる。直接的な答えやリンクを提供してくれるから。でも、仮に彼らが主張の根拠を示せなかったとしても、時にはオープンエンドな質問よりもポジティブな「事実」を検索する方が早いこともある。この場合、直接的な情報源が必要なら、LLMに問い合わせて、確信を持って「多分正しい」回答を得て、その「事実」をグーグルで検索して確認することができる。 「グーグルしているときはインデックスが欲しい」という考えは理解できるけど、グーグルが検索結果を埋もれさせている理由もある。人々はますますインデックスを求めなくなってきているから、ますます役に立たなくなっている。結局、探している情報を見つけるためにあるんだよね。

その点は本当に疑わしいな。チップが手に入りにくくて、電力を大量に消費して、しかもめっちゃ高い業界で、大手がいつでもスイッチを入れて利益を出せるなんて考えにくいよ。彼らは信じられないくらいの現金を使い果たしてるのに、なぜかまだスタートアップって呼ばれてるし。確かに、何かを見つけるまで長い間は存在するだろうけど、ハードウェアの価格や電力消費が下がらない限り、すぐには利益を出せないと思う。YouTubeを見てみてよ:20年もビジネスをやってるのに、AlphabetがYTの純利益を公開しないから、まだ利益が出てるかどうかは不明だし。公にしてる会社なら、赤字じゃない限りそうすると思うよ。

株価が上がるのも、会社が利益を出してる一つの方法だよね。アマゾンのプレイブックは10年以上これだし。

もちろん、でもAlphabetは検索市場で多くのシェアを獲得して、広告を見せることで信じられないほど利益を上げてる。AI企業は、AIが人々にとって同じくらい重要になると賭けていて、製品にある程度の粘着性があると考えてる。つまり、市場シェアは最終的に収益に変わる可能性があるってこと。これらのどちらも比較的可能性が高いと思う。

この分析で理解できないことがある。コストを推定するために使われたLLMのクエリは、LLMにはあまり意味がないと思う。フライトの荷物サイズをLLMに聞くことはないよ。なぜなら、1週間前に追加されたルールで変わるかもしれないし、LLMが数字を幻覚するかもしれないから。ウェブ検索を含むLLMに聞いて、情報源を見つけて答えを確認するべきだよ。これは事実データが必要な質問全般に当てはまる。そうでないと、道端の見知らぬ人にお金がかかることについて聞いてるようなもんだよね。それで、トークンサイズが膨らむのは、LLMがコンテキストに全てのウェブサイトを追加する必要があるから。もし根拠のある答えを求めていないなら、もっとクリエイティブなことをしてるかもしれない。例えば、テキストを書くとかね。その場合、全ての議論がコンテキストとして何度も送られて、答えを得るために繰り返し作業をしてるかもしれない。キャッシングやバッチ処理もあるかもしれないけど、それでもトークンがすごく早く増えるんだ。要するに、トークンの推定はかなり外れてると思う。でも批判だけじゃなくて、これはすごく情報量の多い投稿だったし、実際の消費データがないと、こういうことを推定するのは難しいよね。

「アメリカン航空のDFW-CDG便の最大手荷物サイズは?」って聞いてみたら、ウェブ検索を使って正しい答えを出してくれて、航空会社やFAAのサイトへのリンクもくれた。こんな風に使わない理由がないよね?

いやいや、最近のことについてはいつも質問してるよ。LLMがウェブ検索して、複数のページを読んで要約してくれるからね。4oは常に最新の質問に対してウェブ検索をして、確認できる参考リンクを返してくれるし、もしそうしなかったら検索してって言えばいいだけ。o3はその間にたくさんの検索をして、いろんな角度から見るよ。

でも、これらのLLMには問題があって、企業は大きな問題を解決しない限り、研究に莫大な金額を使い続けなきゃいけない。これらのモデルは本質的に減価償却資産で、新しいモデルが出ると数ヶ月でほぼ完全に価値が下がっちゃう。例えば、Claudeは間違いなくソフトウェア開発者にとって最高のモデルだったけど、Gemini 2.5がリリースされたら、今はGeminiに傾く人が多いよね。ミスの余地がほとんどないのも問題で、Llamaが数ヶ月で完全に無意味になったのを見たから。インファレンス自体は利益が出るかもしれないけど(これも大きな*)、これらの企業は、誰かが幻覚を解決してコンピュータインターフェースをグローバルに再構築しない限り、数十年にわたって戦い続けなきゃいけないと思う。

AIをアプリケーションに統合する開発者にとって、より適切な比較は、同じ数のリクエストを処理するためのインフラコストだと思う。つまり、「1,000リクエストあたり$ xかかっているけど、AIを追加するとどう変わるの?」ってこと。1,000リクエストはAWS Lambdaの無料枠以下だけど、256MBのメモリで1秒間に1,000万リクエストを処理すると、US East Ohioでは$36.80かかる。これで1,000リクエストあたり$0.00368になる [1]。記事の最低価格$0.2 / 1,000リクエストと比べるとかなり安い。EC2インスタンスのコストを見積もるのはちょっと難しいけど、日々のリクエスト量や使用するインスタンスが分からないから。最悪のケースを想定してみよう。m4.largeを2台(2 CPU 8 GiB)使って、1日10,000リクエストを受けて、オンデマンド価格で運用すると、月$146.00 [2]、つまり1,000リクエストあたり$0.49になる。これは記事の選択肢の9/13よりも安い。もし1日の使用量が3倍になったり、スポットインスタンスや年間予約インスタンスを使うと、全ての選択肢よりも安くなる。逆に、m6i.32xlargeを4台(128 CPU 512 GiB)オンデマンド価格で使うと、月$17,940.48 [2]。1日1,000万リクエストだと、1,000リクエストあたり$0.0598になり、これも記事の全ての選択肢より安い。私の比較はあくまで大まかな推定で、不完全だって認めるけど、私にとっては使っていない独占的な検索APIとの比較よりも、より関連性のある比較だと思う。さらに、AI APIにお金を払うよりも、自分でLLMを運用してコストがどう変わるかを見る方がずっといいと思う。 [1] https://calculator.aws/#/createCalculator/Lambda [2] https://calculator.aws/#/createCalculator/ec2-enhancement