世界を動かす技術を、日本語で。

グーグルの液体冷却システム

概要

  • Liquid cooling はPC愛好家だけでなく、 データセンター でも重要性が増加
  • Google をはじめとする企業がAI時代の 高発熱チップ に対応するため導入を加速
  • CDU(Coolant Distribution Unit) などの専用機器で大規模冷却を実現
  • メンテナンス性信頼性 にも独自の工夫
  • AIブーム と共に今後も水冷技術の普及が進行見込み

データセンターにおけるLiquid Coolingの進化

  • Liquid cooling はもともとPC愛好家の間で親しまれてきた冷却技術
  • 近年は AIチップ などの高発熱化により、 データセンター での採用が急増
  • Google は2018年から TPU(Tensor Processing Unit) 向けに水冷を本格導入
  • 最新世代では サーバー単位 ではなく ラック単位 で冷却ループを構築
  • CDU(Coolant Distribution Unit) を6台1ラックで運用、1台停止でも稼働継続可能な冗長設計
  • CDU は冷却液と施設内の水供給の間で熱交換を実施
  • TPUチップ は直列に接続され、ループ最後のチップの冷却要件を基準に設計
  • 分割フロー型コールドプレート で従来型より効率的な冷却を実現
  • TPUv4 では 裸ダイ 冷却を採用し、冷却効率をさらに向上
  • 冷却ポンプの消費電力 は空冷ファンの5%未満、全体の省エネにも貢献

メンテナンスと信頼性への工夫

  • 水冷 の課題である微生物増殖や漏水リスクは データセンター規模 でも同様に存在
  • クイックディスコネクト継手 などでメンテナンス性を向上
  • Google は余剰CDUによる 無停止保守 を実現
  • 部品のリークテストアラートシステム定期保守・ろ過装置 でリスクを低減
  • 標準化された手順 により大規模運用でも一貫した対応が可能

エンスージアストPCとの比較と今後の展望

  • PC愛好家データセンター で水冷の目的や規模は異なるが、基本原理は共通
  • データセンター では スケール信頼性 の要求が桁違い
  • Hot Chips 2025 では NvidiaRebellions AI なども水冷システムを展示
    • Nvidiaの GB300サーバー は外部水冷接続と柔軟なチューブ構成
    • Rebellions AIのデモでは チラー と水冷ブロックを使用
  • AIブーム が続く限り、 水冷技術 の重要性と普及は今後も高まる見通し

コミュニティへの案内

  • 本記事が参考になった場合、 PatreonPayPal での支援も検討推奨
  • Discord コミュニティへの参加も歓迎

Hackerたちの意見

TPUチップはループ内で直列に接続されているから、自然にループ内の他のチップを通過した液体は、いくつかのチップがより熱くなることを意味するよ。冷却能力は、各ループの最後のチップの要求に基づいて予算が組まれているんだ。もちろん、4つのチップがそれぞれ250Wの電力を出していて、ポンプが1分間に1リットルの水を通している場合、出口の水は入口の水より14°C高くなる必要がある。これは、水がチップを直列に流れる場合でも、並列に流れる場合でも同じことだね。

うーん…でも、チップが直列の場合、最後のチップからの熱伝達は並列の場合よりも少なくなるよね。なぜなら、加熱の速度は温度差に比例するから。並列の場合、最後の理論上のチップのために水は低い温度から始まるし。

つまり、シリーズ接続だと、一番熱いチップを冷やすために他のチップが過剰に冷やされるってことだね。同じ効果を得るためには、もっと水を流さなきゃいけない。

君のコメントには一理あるけど、実際のエンジニアリングにはあまり関係ないね。エネルギーの移動速度は温度差に比例するから、必要な流量を計算することになるけど、チップがシリーズ接続か並列接続かでその流量は変わってくる。

メインフレーム(S/3x0、Crayなど)が50年以上も水冷されてきたのに、超密度のHPCデータセンターが少なくとも20年間液体冷却を使ってきたことを考えると、Google規模のデータセンターの設計がPC趣味のリグと比較されるのは非常に奇妙だね。選択的な健忘症と、笑えるほど的外れな比較ポイントだよ。

ハイパースケールデータセンターは通常、電力密度を気にする必要がなくて、設計者はそれが引き起こす問題から密度を避けることがあるんだ。密度を気にしている現代のHPCクラスターは、たぶん誤った方向に進んでいると言えるけど、MLワークロードに関しては、物理的に近くに配置することで相互接続性の面での利点が出てくるんだよね。

記事から: > 液体冷却はPC愛好者にとって馴染みのある概念で、企業コンピューティングでも長い歴史があるんだ。そして、データセンターのトレンドは、個々のサーバーでより受動的な冷却と高温動作に移行することだった。これは面白いことに、そのトレンドを大きく逆転させているし、おそらくは行ごとの冷却のためだね。

Googleの歴史を考えると、安価なコモディティハードウェアから来てるから、あまり驚かないよね。x86サーバーやOSが仮想化みたいなメインフレーム機能を得るのに数十年かかったのと似てる。https://blog.codinghorror.com/building-a-computer-the-google...

[bri3dが指摘してくれたけど、俺がこの要素を見逃してたんだ。ラックレベルとマシンレベルの冷却液の間に転送があって、最初に理解してたほど新しいことじゃないってこと。彼らの直接のコメントを見てみてね] これについては、返信の中でさらに詳しく書いたけど、もう少し上の方で言っておくべきだね:ここでの革新は「冷却に水を使ってる」ってことじゃない。ここでの革新は、施設の外にあるチラーでサーバーを直接冷却してるってことなんだ。ほとんどのメインフレームは、コアから熱を取り出して、従来のヒートシンクや冷却ファンで拾えるエッジに運ぶために水冷を使う。家庭用PCでも、熱をより効果的に冷却できる貯水槽に移動させてる。Googleがやってるのは、通常は施設内の空気を冷却するために使う巨大なチラーを使って、水を冷却して、それを直接すべてのサーバーにポンプで送ってるんだ。戻ってきた水はチラータワーで冷却される。これでチラータワー以外の空気ベースの転送が完全に排除される。これはサーバーやラック単位でやってるんじゃなくて、データセンター全体で一度にやってるんだ。チラーのメンテナンスやポンプの故障をどう扱ってるのかめっちゃ気になる。冗長性はあると思うけど、そのシステムはすごく印象的じゃないとダメだよね。ハードウェアの故障が起きる前に長時間オフラインにはできないから! [編集:別のコメントで指摘されたけど、AWSもこれをやってるみたいで、正直彼らの写真を見ると何が起こってるのかがすごくわかりやすいよね: https://www.aboutamazon.com/news/aws/aws-liquid-cooling-data...]

これがGoogleの典型的なやり方だね。彼らは物事を再発明して、自分たちが最初だって言うんだ。Googleはコストに敏感だから、こういう問題に対する解決策は他にもあるかもしれないけど、彼らはそれにお金を払いたくないんだ。彼らの規模では、物事を再発明して内部でやる方が安上がりで、そして最初だと主張するんだよね。

AIが水を無駄にしているという話をよく聞くけど、これはその一例かな?もしかしてCDUが施設の水供給を使って蒸発冷却をしているとか?

CDUはデータセンター内にあって、厳密に液体同士の交換を行っている。ラックブロックの冷却液から施設の冷却液に熱を移すんだ。施設はその後、屋外の熱交換を行うために、時にはオープンループの蒸発冷却(冷却塔に水を噴霧する)を使うこともある。すべてのデータセンターには何らかの形の施設冷却があって、CDUやローカル水冷があってもなくても、特に関係ないんだ。AIと水の話はちょっと疲れるよね。水は水循環の中で効率的な部分や場所に移動するだけだから。もし水に関連する外部要因を正確に価格に反映できるなら、「総稼働エネルギー消費」の指標の方がずっと役立つと思う。データセンターが水を蒸発させるために大量のエネルギーを使っているのか、それとも大したことないのか、っていうのが重要だよね。結局、これは水の市場がどれだけ非効率的で不正確に価格設定されているかを示しているだけなんだ。特にアメリカでは、水の権利や価格、特定の場所での水の実際の利用がしばしば驚くほど相関していないから。

AIが水を無駄にしているという話がよく出る理由は、アメリカで知識、科学、技術を破壊しようとする大規模な影響操作があるからなんだ。私たちの多くを最低限の生活状態に戻し、単純作業をさせたり、文字通り奴隷状態にしたりしようとしているんだ。AIが使う水について、少しでも心配するような主観的な基準は存在しないよ。

AIが水を使うって話、よく見かけるけど、詳しいことはあまり書いてないよね。車が道路を使うみたいに水を使ってるのかな?道路はほとんど変わらない?無駄だっていうのは明らかだけど、もしそれを裏付けるデータがあったら、読者に推測させるようなことにはならないと思う。水が消費されるって言うなら、飲める水が飲めなくなるか、何か別のものに変わって再利用できない状態になるかのどっちかだよね。蒸気に変えたり、 sludge に閉じ込めたりとか。そういうことが起こってるの?もしそうなら、それって悪いことなの?なんで?この件についての答えが見たいな。数字が具体的に何を指してるのかもわからずに使われてるのを見て、すごくイライラする。

AWSも数ヶ月前に似たような記事を出してたよね:https://www.aboutamazon.com/news/aws/aws-liquid-cooling-data... どちらにしても、出力水から熱をどうやって排出して再利用してるのかがわからない。そっちの方がずっと興味深い問題だと思う。

水冷の経済性って実際どうなんだろう?チップが高くなってるから、液冷で速く動かす方が経済的なのかな?それともデータセンターのスペースが高くなってるから、密度の高い液冷の方が理にかなってるのかな?それとも配線距離(1フィート=1ナノ秒)が密な計算を速く効率的にしてるのかな?

古典的なコンピューティングの需要についてはよくわからないけど、TPUみたいなメモリ重視の計算では配線距離が重要だと思う。

これは非効率の証明みたいなもので、年々TDPが上がっていくのは、nmプロセスが小さくなるにつれて損失が大きくなってるからだよね。ひどい状況で、消費者向けのNvidiaですら、普通に使ってるだけでコネクタが溶けないように設計できないくらい、電力消費が異常になってる。残念ながら、ゴールドラッシュの時にクソみたいなシャベルについて文句を言う人はいないんだよね。みんな、無くなる前に手に入れられたことに満足してる。性能が上がり続ける限り、効率を革新するインセンティブがないんだ。

これは2と3の混ざった感じだね。チップが熱くなってるのは、狭いスペースにもっと多くのものを詰め込んで、さらにパワーを入れてるからだよ。同時に、コンピュータを冷やすためのファンを動かすのにもかなりの電力が必要なんだ(ラックがたくさんあると、その小さなファンもすぐに合計で大きな電力になるし)。その熱はホットアイランドに吹き込まれて、エアコンに循環させる必要がある。液体冷却を使うことで、電力使用量が減ってコストを節約できるし、チップから空気を経由してエアコンを通して液体にするのではなく、直接液体同士で冷却できるんだ。ServeTheHomeが去年これについて書いてたよ、https://www.servethehome.com/estimating-the-power-consumptio...

チップが非常に高いビットレートでネットワーク接続されていて、物理的に密に詰め込まれているからなんだ。

B1Mからちょっと関連する話… >「パリオリンピックのプールはインターネットで温められている」 >https://www.youtube.com/watch?v=2gWudPtN6z4&t=4s

GoogleがAI競争で持ってるモートって、データセンターの社内専門知識とTPUの社内知的財産のおかげでどれくらいあるんだろう?地球上のどの会社も彼らに匹敵できるのかな?

オープンソースのモデルが出てきて、全部無意味になるほどじゃないと思うけど。

一度、Azureデータセンターの建設を監督してるSVPのインタビューを見たことがあって、彼が言ったことが印象に残ってるんだ。彼は、自分の仕事が楽になったのは、もはやコンピュータビジネスではなく、産業冷却ビジネスにいることに気づいたからだって。この記事を読んで、すぐにそのことを思い出したよ。

俺が理解できないのは、なぜ工業プロセスで見たものを使わないのかってこと。低沸点の液体と熱交換器を使わないの?それとも、バイオガスプラントみたいにタービンを動かす方がいいんじゃない?

2006年から2012年まで、データセンターに通ってたんだ。住んでたわけじゃないけど、変な時間に行くことが多くてさ。あそこは居心地が悪い場所だよ。冷却がもうちょっと静かで極端じゃなければ、もっと好きだったのに。インターフェースが裏側にあるのは、吸気側だからなんだ。だから、セーターを持って行くといいよ。もしくは、ラックの反対側に行って手を温めるとかね。

理論的にはデータセンターの冷却はシンプルなんだ。CPUは60〜70℃で動いてて、外の気温は通常30℃以下だから、熱はちょっとファンやポンプの助けを借りて「下に流れる」はずなんだ。でも、空気冷却を使うと問題があって、データセンターを運営してる人たちが、コンピュータを冷やすために使ってる空気を吸わなきゃいけないんだ。もし作動液が熱くなりすぎると、彼らにとってはかなり不健康なんだよ。(うちはホットアイルを100°F(約38℃)で運用してて、ちょっと暑いけど、3つおきに熱交換器があって、外の蒸発冷却装置からの冷水ラインで動いてるんだ。バードシットを防ぐための熱交換器も入れてるけどね。)作動液が外気よりかなり熱くないと、外に熱を排出するのは難しいから、外がそれなりに暖かくなると、冷却装置(水冷式エアコン)をループに入れなきゃいけないんだ。これが熱を高温の排気に集中させるためにエネルギーを消費するんだよ。外が本当に暑いときは、かなりのエネルギーを消費するしね。もしデータセンター全体が液体冷却だったら、ラックからもっと高温の冷却液が出てきて、最も暑い日でも冷却装置なしで熱を外に排出できるんだけどね。今は、同じ冷水ラインから動いてる液体冷却のラックもあるけど、冷却液の温度はホットアイルの温度に制限されてて、もう十分に熱いから、ありがとうって感じだよ。

15年前、IBMがETHチューリッヒにスパコンを設置したんだけど、60℃の温水を冷却液として使ってて、建物の温水システムと熱交換器がつながってたんだ(通常は60℃未満だよ)。https://en.m.wikipedia.org/wiki/Aquasar