Apple SiliconはOpenRouterよりも高価です

2026年5月17日原文(williamangel.net)

概要

Apple Silicon搭載のMacBook Proは、OpenRouterと比較してコストが高い。電気代よりもハードウェアの減価償却費がコストの大部分を占める。ローカル推論はOpenRouterよりも処理速度が遅い。 OpenRouterの方が1トークンあたりのコストが安価。一般的な用途ではクラウド利用が経済的で効率的。

Apple SiliconとOpenRouterのコスト比較

Apple Silicon 搭載の M5 MacBook Pro は、 50-100ワット の消費電力
- $0.20/kWh の電気代で、1時間あたり数セントのコスト
- 1日24時間フル稼働で 1日あたり$0.48 の電気代
ハードウェアコスト が主要コスト要因
- 14インチ M5 Max/64GB RAM モデルは $4299
- 3年、5年、10年の耐用年数で年間コストは $1433/$860/$430
- 1時間あたりのコストは $0.16/$0.10/$0.05
減価償却 によるコストが電気代より大きい
- 長期利用（7-10年）ならコスト低減可能
- 推論専用で使う場合は3年程度が現実的

トークン生成速度とコスト計算

Gemma4:31b のローカル推論速度
- 10-40トークン/秒 （M5 Max実測値）
- 1時間あたり 36,000～144,000トークン
3年～10年耐用・$0.18/kWhの場合
- 100万トークンあたり$1.61～$4.79 （10トークン/秒時）
- $0.40～$1.20 （40トークン/秒時）
OpenRouter で同等モデルのコスト
- 100万トークンあたり$0.38～$0.50
- ローカル最良条件でもクラウドと同等、悪条件では 10倍 のコスト差
現実的にはローカル推論は3倍程度コスト高 となる見込み

速度とユーザー体験

推論速度 が最大の差異
- OpenRouterでは 60-70トークン/秒 のプロバイダも存在
- Pro Maxでは 10-20トークン/秒 が一般的
- クラウドの方が 3-7倍高速
人件費 と比較した場合
- 社員の給与コストはローカル推論で生成できるトークンコストの 1000倍以上
- ビジネス用途では クラウド利用が合理的

総括

Apple Silicon でのローカル推論は コスト・速度面でOpenRouterに劣後
Gemma4:31b クラスのモデルが消費者向けデバイスで動作する点は革新的
実務やビジネス用途では クラウド推論 が依然として優位
個人利用や趣味用途ではローカル推論も選択肢となりうる

Hackerたちの意見

俺の理解が間違ってなければ、トークン生成のコストにノートパソコン全体が含まれてるってことだよね。計算が、LLMの出力を受け取るだけじゃなくて、お金を払ってノートパソコンも手に入れてるってことを無視してる気がする。もしこのマシンを暗い隅に置いて、トークンを生成するだけのサーバーとして使うつもりなら、ノートパソコンはその目的には全然向いてないよ。でも、ノートパソコンを普通に使うつもりなら、ノートパソコンがあるのはかなり大きなメリットだよね。プライバシーや検閲からの自由、使うモデルに対するコントロールも得られるし（特定のモデルの特性に基づいてワークフローを構築した後に、3ヶ月後に rugpull されることもないし）。

└

そうだね、もっと良い指標は、ローカルモデルを動かすために必要なノートパソコンのコストと、どうせ買うつもりだったノートパソコンのコストの違いかもしれないね。

└

使用するモデルに対するコントロールがあるけど、最も能力の高いモデルにはアクセスできなくなって、小さいモデルしか動かせないよ。

└

LLMの出力を受け取るだけでなく、お金の代わりにノートパソコンも手に入れたんだ。そして、Macだから、アップグレードする準備ができたときには、まだかなりのリセールバリューがあるよ。

└

OPは、精神的におかしくなってMacを抱え込んでる人たちと比べて、絶対に最高のケースを提示してるよ。これらの人たちの中には、まだ計算ボトルネックになってるMac Studioに$10,000以上も使った人がたくさんいるけど、Gemma 4より効率的なものはないんだ。

著者は出力トークンのコストだけを比較してるけど、典型的なエージェント的な作業負荷では、入力トークンがコストの大部分を占めるんだ。ローカルで推論を実行すると、入力トークンは、第一義的には、タダみたいなもんだよ。（実際には、初トークンまでの時間が長くなったり、電力消費が増えたり、トークン出力速度が下がったりすることで、間接的なコストが発生するけどね）。

└

そうだね、それで彼の主張は完全に無効になっちゃう。OpenRouterのアクティビティでいくつかのランダムなエージェントセッションを見てみたけど、入力コストは出力コストの10倍だった。OpenRouterのプロンプトキャッシングは複雑で信頼性がないし、ローカルハードウェアのllama-cppではほぼ無料だよ。

└

ローカル環境でのキャッシングを無視しても、Macのハードウェアは入力トークンを出力トークンの約10倍の速さで処理できることが多いよね。Openrouterは同じモデルで2倍の差しかないみたい。

これは良い分析じゃないね。全てを楽観的に丸めすぎてるから。電気代を10%上乗せしてるし、電力使用の範囲から高い方を取って（低い方の2倍）、それを膨らんだ電気代で掛け算してる。でも、その後新しく買ったMacを使って推論を行い、フル稼働で24時間365日動かすって話になる。なんでそんなことするの？Appleシリコンは速いけど、著者が指摘してる通り、1秒あたり10〜40トークンしか出ないんだ。悪くはないけど、これには向いてないよ！リンゴとオレンジを比べてるみたい。そう、データセンターは家庭用の電気料金を払わないし、データセンターは電力効率の良いチップを使ってる。データセンターはMac用に設計されてないチップを使ってる。Appleシリコンは、24時間365日トークンを消費しないなら、結構いい感じだし、特にそれをするためにハードウェアを買ってるわけじゃないならね。俺は週に数回、必要なことのためにMac Studioを使うけど、tailnet上で「無料」でollamaを動かせるよ。経済的には、Mac StudioをH100クラスターのように動かそうとしなければうまくいく。これは誰にとっても驚きじゃないはずだよ：安い電気でマルチテナントのハードウェアを使えば、トークンあたりのワット数が多い方が常に勝つから。

└

全てを最も楽観的な設定で丸めたら、百万トークンあたり0.40ドルになったし、openrouterでは同じモデルが0.38ドル/mtokだよ。

└

24時間365日使うと、平均コストは下がるんだよ。ローカルLLMをあまり使わないなら、使わないために高いハードウェアを買った意味がなくなるからね。

└

今のデータセンターの流行、効率的に見えないよね。

Hacker Newsで議論の続きを見る

ハクソク

Apple SiliconはOpenRouterよりも高価です

概要

Apple SiliconとOpenRouterのコスト比較

トークン生成速度とコスト計算

速度とユーザー体験

総括

Hackerたちの意見