世界を動かす技術を、日本語で。

第八世代TPU:エージェント時代のための二つのチップ

2026年4月22日原文(blog.google)

概要

  • Googleが第8世代の Tensor Processor Unit(TPU 8t/8i) を発表
  • TPU 8tは大規模なAIモデルのトレーニング、TPU 8iは 高速推論 に特化
  • 効率性と性能の大幅向上 を実現するカスタム設計
  • 今年後半に一般提供予定、事前情報リクエスト可能
  • AIエージェント時代 に向けたインフラ進化の象徴

Google第8世代TPU「TPU 8t/8i」発表

  • Googleが Tensor Processor Unit(TPU)第8世代 を発表
  • TPU 8t :大規模AIモデルの トレーニング 専用設計
  • TPU 8i低レイテンシ推論 に最適化されたチップ
  • 10年以上の開発の集大成であり、 Gemini など主要AI基盤モデルも支援
  • Google DeepMind と共同設計による最先端AIワークロード対応

TPU 8tの特徴

  • 計算性能 :前世代比で 約3倍 の計算能力を1ポッドで実現
  • 大規模スケール :1スーパー・ポッドで 9,600チップ、2PBの共有高帯域メモリ
  • インターチップ帯域 :前世代の 2倍、合計 121 ExaFlops の計算力
  • 最大活用10倍高速なストレージアクセス、TPUDirectによるダイレクトデータ転送
  • 高い信頼性97%以上の「goodput」 を目指し、RAS機能を強化
    • リアルタイムテレメトリ、自動障害検知・迂回、 Optical Circuit Switching による無停止リカバリ

TPU 8iの特徴

  • 推論最適化 :多エージェント協調や反復処理に最適
  • メモリ強化288GBの高帯域メモリ384MBのオンチップSRAM (前世代比3倍)
  • Axion ARMベースCPU物理ホスト数2倍、NUMA構成で性能最適化
  • ネットワーク革新ICI帯域19.2Tbps、新アーキテクチャ「Boardfly」で低レイテンシ
  • CAE搭載 :オンチップCollectives Acceleration Engineで 遅延最大5倍削減
  • コスト効率 :前世代比 80%性能向上/コスト同等 で処理量2倍

共通技術・エコシステム

  • JAX、MaxText、PyTorch、SGLang、vLLM など主要フレームワークに対応
  • ベアメタルアクセス 提供、仮想化オーバーヘッドなし
  • MaxTextリファレンス実装Tunix などOSS貢献
  • Axion ARMベースCPU によるシステム全体最適化
  • 第4世代液冷技術 で高密度冷却・省電力化
  • シリコンからデータセンターまで 一貫した効率設計
  • Google Cloud Hypercomputer の一部として利用可能

電力効率とインフラ進化

  • 性能当たり電力効率2倍 (前世代Ironwood比)
  • ネットワークと計算を同一チップ上で統合 しデータ移動コスト削減
  • 最新データセンター は5年前比で 6倍の計算能力/電力単位
  • 液冷分配ユニット による高密度運用
  • 全スタック最適化 による持続可能なAIインフラ

AIエージェント時代への対応

  • 連続的な推論・計画・実行・学習ループ に対応するインフラ
  • TPU 8t/8i はAIモデル構築・推論・エージェント協調作業を再定義
  • 今年後半に一般提供開始予定
  • Google Cloud Hypercomputer として統合運用可能
  • 新時代のAIインフラ への転換点となる製品

まとめと今後

  • TPU 8t/8i はAI開発・運用の 効率・性能・スケール を大幅に向上
  • 事前情報リクエスト受付中、 業界最先端のAI基盤 構築を支援
  • Googleのイノベーション が現実のブレークスルーを加速

Hackerたちの意見

1つのTPU 8tスーパーポッドは、今や9,600チップと2ペタバイトの共有ハイバンド幅メモリにスケールアップできるんだって。前の世代の2倍のインターチップ帯域幅を持ってるし。このアーキテクチャは121エクサフロップスの計算能力を提供して、最も複雑なモデルが1つの巨大なメモリプールを活用できるようになってる。すごいと思うけど、詳しくないから実際はそんなにすごくないのかもしれない。でも、私の目から見ると、Googleにとって競争優位性があるように見えるね。

そうだね。指示とデータの分離に関するブレイクスルーがない限り、AGIはまだ作れないよ。

他の企業がニュースに注目されてる中で、Googleは静かに力をつけて消費者市場のシェアを獲得してるように思う。AIに関しては、初日から縦割りで統合されてるから、あまり(ほとんど?)インフラの問題もないみたいだし。一時期は絶望的に見えたけど、まるで潮のように、どんどん成長してる感じ。

おそらく、君はGemini 3を使ったことがないんだろうね。あれは信頼性が低すぎて、提供しない方がマシだったかも。ここでみんながClaudeやCodexにワクワクしてる理由もわかるけど、Antigravityにはあまり興味がないんだよね。とはいえ、実際に同意するよ:Googleは個人的には「ノーマルビジネス」のチャットボットエリアで静かに支配してると思う。Geminiは日常的なことには結構いい感じだよ。

そうだね、数年後(1〜2年?)にはGoogleとAppleの両方がケーキを食べる時が来ると思う。彼らは毎月未完成の製品を急いでリリースして評価を倍増させるゲームをしてるわけじゃないし、じっくり考えて観察して、本当に洗練されたものを出す時間がある。少なくともそれが希望だね! :)

彼らの最新のオープンモデルは、他のオープンモデルとかなり競争力があるし、サイズが小さい(2〜4GB)モデルに関する革新も進んでる。スマホや他の小型デバイスで現実的な品質の推論に近づく手助けをしてるよ。

AIの導入は、GoogleにとってはOAIやAnthropicほどの重要性はないね。他の二社みたいに盛り上がることもできないし、彼らの言うことはただの企業の戯言に聞こえちゃう。

Googleは静かに消費者市場のシェアを獲得して、インフラの問題もあまりないみたいだね。AIに関しては最初から縦に統合されてるし。Google Antigravityのサブレディットはひどいけどね: https://www.reddit.com/r/GoogleAntigravityIDE/

現在、大規模なAIをやるには基本的にNVidiaから買うか、Googleからレンタルするしかないよね。Googleはデータセンター全体の文脈でチップやエンジン、システムを設計できるから、チップベンダーには不可能な部分を中央集権化できる。だから、本当に大きくなった時には、Googleのシステムが常にコスト効率が良いと思う。(開示:私はGOOGに長期投資してるよ、これと他のいくつかの理由で)

もし彼らの経営陣がこんなにインスピレーションがないわけじゃなかったら、私も賭けると思う。クックの下のAppleもかなり穏やかで、ジョブズからは大きく後退したけど、Googleは崖から落ちた感じがする。OpenAIがChatGPTをリリースしてなかったら、彼らはその技術に座ったままで、内部でしかテストしてなかったかもしれない。今やそれが彼らの全てのチップR&Dを駆動してる。

Gemini CLIを使って、CodexやClaudeに近い体験ができるなら、Googleに長期投資したいと思うけどね。彼らは素晴らしいハードウェアを持ってるかもしれないけど、フラッグシップのコーディングエージェントがターンのトークンを見つけるのにループにはまっちゃうなら、意味がないよ。

アマゾンも同じことやってるんじゃないの?自社のTPUを作ってるみたいだし。

Hacker Newsで議論の続きを見る