概要
Apple Silicon搭載のMacBook Proは、OpenRouterと比較してコストが高い。 電気代よりもハードウェアの減価償却費がコストの大部分を占める。 ローカル推論はOpenRouterよりも処理速度が遅い。 OpenRouterの方が1トークンあたりのコストが安価。 一般的な用途ではクラウド利用が経済的で効率的。
Apple SiliconとOpenRouterのコスト比較
-
Apple Silicon 搭載の M5 MacBook Pro は、 50-100ワット の消費電力
- $0.20/kWh の電気代で、1時間あたり数セントのコスト
- 1日24時間フル稼働で 1日あたり$0.48 の電気代
-
ハードウェアコスト が主要コスト要因
- 14インチ M5 Max/64GB RAM モデルは $4299
- 3年、5年、10年の耐用年数で年間コストは $1433/$860/$430
- 1時間あたりのコストは $0.16/$0.10/$0.05
-
減価償却 によるコストが電気代より大きい
- 長期利用(7-10年)ならコスト低減可能
- 推論専用で使う場合は3年程度が現実的
トークン生成速度とコスト計算
-
Gemma4:31b のローカル推論速度
- 10-40トークン/秒 (M5 Max実測値)
- 1時間あたり 36,000~144,000トークン
-
3年~10年耐用・$0.18/kWhの場合
- 100万トークンあたり$1.61~$4.79 (10トークン/秒時)
- $0.40~$1.20 (40トークン/秒時)
-
OpenRouter で同等モデルのコスト
- 100万トークンあたり$0.38~$0.50
- ローカル最良条件でもクラウドと同等、悪条件では 10倍 のコスト差
-
現実的にはローカル推論は3倍程度コスト高 となる見込み
速度とユーザー体験
-
推論速度 が最大の差異
- OpenRouterでは 60-70トークン/秒 のプロバイダも存在
- Pro Maxでは 10-20トークン/秒 が一般的
- クラウドの方が 3-7倍高速
-
人件費 と比較した場合
- 社員の給与コストはローカル推論で生成できるトークンコストの 1000倍以上
- ビジネス用途では クラウド利用が合理的
総括
- Apple Silicon でのローカル推論は コスト・速度面でOpenRouterに劣後
- Gemma4:31b クラスのモデルが消費者向けデバイスで動作する点は革新的
- 実務やビジネス用途では クラウド推論 が依然として優位
- 個人利用や趣味用途ではローカル推論も選択肢となりうる