世界を動かす技術を、日本語で。

TSMCが異例の光学技術に賭ける

概要

  • TSMCAvicena と提携し、 microLEDベースの光インターコネクト 開発を発表
  • 光接続 によるAIデータセンターの 省エネ・低コスト化 を目指す動き
  • レーザー非依存型 の技術で 信頼性・コスト・消費電力 の課題を解決
  • 既存のLED・カメラ技術 を活用し、 量産・低価格化 を加速
  • 性能・エネルギー効率 でシリコンフォトニクスを凌駕する実績

TSMCとAvicenaによるmicroLED光インターコネクトの挑戦

  • TSMCSunnyvale発スタートアップAvicena と連携、 microLEDベースのインターコネクト 量産化
  • AIデータセンター 内の GPU間通信 における 帯域・遅延・速度・データ量 の急増が背景
  • 銅配線から光接続への移行 が必然となる時代
    • Lucas Tsai (TSMC副社長) 「光接続をできるだけ基板近くまで持っていく動きが加速」
  • AvicenaのLightBundleプラットフォーム
    • 数百個の青色microLEDイメージング用ファイバー で接続
    • レーザーを使わず、信頼性・コスト・消費電力の問題を回避
    • 短距離用途 に最適化された設計

レーザー非依存型光インターコネクトの特徴

  • 従来の光接続 は主に レーザーと変調器 を用い、 複雑な波長多重 が必要
    • レーザーとファイバー結合信頼性・製造・コスト の課題
    • 複数GPU間リンク での 計算オーバーヘッド 増大
  • Avicenaのアプローチ
    • 各10Gb/sのデータレーン ごとに 個別ファイバー を用意
    • 送信側はミニディスプレイ、受信側はカメラ のような構成
    • レーザーの複雑さを排除 し、シンプルな光リンクを実現

microLED光インターコネクトのスケーラビリティと優位性

  • 300ピクセル×10Gb/s10m距離・合計3Tb/s を実現
  • ディスプレイ・カメラ技術の拡張性更なるデータレート・高密度化 が可能
  • 既存のLED・カメラ・ディスプレイ産業 を活用
    • 新規部品開発不要量産・コスト低減 を迅速に実現
    • シリコンフォトニクス新規部品(リング共振器・コムレーザー等) の成熟に時間が必要
  • TSMCAvicenaの光チップレット用フォトディテクタアレイ を製造
    • LEDは低消費電力10m程度の距離 なら十分
    • 冗長性・低コスト化 の可能性

実績と今後の展望

  • AvicenaのLightBundle試作機リンク全体でsub-pJ/bitのエネルギー効率 を実現
    • 他の光技術は 5pJ/bitで苦戦
  • 成熟した技術基盤優れた実績 が業界の支持を拡大
  • 今後の課題製品の構築とスケールアップ
  • 成熟産業の活用+実証済みの性能光AIデータセンター 時代の切り札

Hackerたちの意見

私の理解では(高速電子機器の設計から)、銅のデータ/クロックレートの主な制約は信号の整合性の問題だよ。不要な電磁相互作用が信号を劣化させちゃう。光学技術は確かにこの問題を回避する方法だけど、いつか同じような限界に達するのか気になるな。

幸運なことに、光子はボソンだからね(もし極限まで進めたらだけど)。

光子同士の相互作用に必要なエネルギー密度は、心配する必要があるレベルをはるかに超えてるから、問題にならないよ。それに、光子は地元のポテンシャルバリアを無視して、予測可能なチップ設計のエネルギーレベルやスケールでトンネルするわけじゃないからね。

銅でも減衰は問題じゃないの?小型電子機器の場合、適切なアンプがあれば無視できるのかな?つまり、干渉がなければ、電子はインピーダンスに直面して情報を失い始めるってことだよね。

光学技術にも信号の整合性の問題があるよ。実際には、OSNRやSNRが光学技術を制限してる。光ファイバーを切るとやっぱり壊れちゃうし、小さな振動も信号の位相に影響を与えるんだ。

海底ケーブルではすでに光の非線形性の問題に定期的に直面してるよ。高帯域幅のファイバーで生成される瞬時のEMフィールドは、ファイバー媒質との非線形相互作用を引き起こすには十分強いから、補正が必要なんだ。

送信機はミニチュアのディスプレイスクリーンのように機能し、検出器はカメラのように働く。だから、映画をストリーミングしているとき、実際にデータセンターの中で映像が見えるってこと?

もしかしたら、圧縮されていない低解像度のビットパックされたバイナリ動画かも。

いや、これは単なるアナロジーだよ。実際にはデータは大幅に変調されていて、映像もエンコードされているから、視覚的に画像のように見えるものが光ファイバー内で見えることはないんだ。

明らかに、これは動画圧縮やパケットの仕組みとは違うけど、議論のために考えてみて。記事では300本のファイバーケーブルについて話してる。1ビット・パー・ピクセルの正方形画像で、約300ピクセルならサイズは17x17だね。普通の動画解像度じゃないよ。

ネットワーク接続でビットが来るたびにLEDを点滅させるのと同じくらいだよ。

その話では「ファイバーバンドル」に300本の光ファイバーがあるって言ってるね。これが20x15の配置だと仮定して、LEDの波長が可視で十分明るいとするなら、もしエンコードされてないモノクロの20x15の映画がすべてのフレームで整列して、10E9 FPSでレンダリングされてたら、はい、その映画はこれらのケーブルの一端で虫眼鏡を通して見えるだろうね。

ヘッドラインがちょっと誤解を招くね。これは誰かのための建物検出器であって、「賭けてる」わけじゃないよ。

この言葉は主に金融投資の促進に使われるね。多分、ブロガーやキャスターを引きつけて、誰かのためにお金を稼ぐために書かれてるんじゃないかな。

「ベット」っていうのは、結果が出ないかもしれないものに時間とお金を投資することだよ。ビジネス用語としては結構一般的だね。

通信の専門家じゃないけど、SerDesがこのアプローチの新しいボトルネックになるのかな?シリアルインターフェースがパラレルよりも優位になる理由があると思うけど、レーン間のタイミングずれが関係してるかも。これを大規模なパラレル光インターフェースでどう解決するんだろう?

レーン間のタイミングずれ それが大きな要因だね。初期のペンティウム4の頃、マザーボードのPCBトレースに目に見える「うねり」が増えてきたのを覚えてる。要するに「これらのラインは他のラインと同じ長さになるようにもっと長くする必要がある」ってこと。記事が説明してるケースでは、両端にコネクタがある「ハーネスケーブル」を想像してるんだけど、そのケーブル内のファイバーは全部同じ長さだから、タイミングずれの問題はないんじゃないかな。(代わりに、曲げ半径の制限を心配する必要があるけど。) > SerDesがこのアプローチの新しいボトルネックになるのかな? そうだと思うけど、同時に普通のMUX/DEMUXよりも難しい問題かどうか決めかねてる。

SerDesはすでに頻繁にパラレル化されてるよ。違いは、エッジやビット全体が同時に到着することは期待しないってこと。リンクごとにタイミングを回復するようにシステムを設計するから、ずれがラインレートの制約にならないんだ。

シリアルインターフェースがパラレルよりも優位になる 半分正しいかな。例えば、PCIeはコンピューティングで依然として優位だよ。PCIeは技術的にはシリアルプロトコルで、新しいバージョンのPCIe(7.0がもうすぐリリースされる)ではシリアル伝送速度が上がる。でも、PCIeは「レーン」によってパフォーマンスニーズに応じてパラレルにスケーラブルでもある。1レーンは合計4本のワイヤーで、2つの差動ペアに配置されていて、1ペアが受信(RX)、もう1ペアが送信(TX)用。PCIeは最大16レーンまでスケールアップできるから、PCIe x16インターフェースは64本のワイヤーで32の差動ペアを形成する。PCIeトレースをルーティングする際、全ての差動ペアの長さはどうやってこの大規模なパラレル光インターフェースで解決するのか?ハードウェアの観点からは、リンク制御用にストーリーのMicroLEDトランスミッターアレイの「ピクセル」をいくつか確保して、データ転送用ではなくするべきだね。例としては、クロックやデータフレームの同期信号が考えられる。ソフトウェア側では、エンドポイント間で安定した接続を交渉し、チェックサムを組み込む通信プロトコルを設計する。技術が進化するにつれて、シリアル対パラレルのダイナミクスは変わる。クロックレートを上げてデータを早く流す(シリアル改善)はある程度まで有効だけど、最終的には現在の技術の限界に達する。もっと帯域幅が必要?それなら、ニーズに合わせてもっとラインを追加すればいい(パラレル改善)。最終的に技術が進化して、ダイナミクスは続く。PCIeがその完璧な例だね。

各ファイバーで10 Gb/sを実現してるんだけど、10 Gb/sに到達するためには、すでに並列から直列への変換を経てるんだよね(ASICやFPGAのクロックレートはかなり低いし)。直列レートを上げるのが実際のボトルネックなんだ。最適な直列レートは各トランシーバーのコストに大きく依存するけど、例えば長距離光リンクは最大1 Tb/sの直列レートで動作する一方、データセンターの相互接続は10-25Gの直列だと思う。

この記事は詳細が少なくて、いろんなことを混ぜてるね。マイクロLEDを従来のWDMファイバー伝送システムと比較してるけど、データセンターの相互接続にはすでにたくさんの光リンクがあって、VCSEL(垂直共振器面発光レーザー)を使ってるから、製造コストがかなり安いんだ。人々はこれをアレイにして、多コアファイバーに結合してる。ここでの難しさはほとんどいつもパッケージング、つまりレーザーの結合なんだ。マイクロLEDがどうして良いのかはよくわからない。10 Gb/sをLEDで送信するのは難しそうだし。非コヒーレントLEDの帯域幅は大きいから、かなりのDSP(コストやエネルギーがかかり、遅延を引き起こす)をやってるのか、それとも非常に短い(数十メートル)リンクに制限してるのかな?

短いリンクは記事に載ってるよ。

各リンクで直接変調IMDDを使ってるんじゃないかな?だからDSPの負担はダイオードのコヒーレンスとは関係ないのかも。記事でも確かに非常に短い距離について言及してるね。

この記事はチップの相互接続についてだよ。PCIeやNVLink、HBM/DDR RAMバスを光通信に置き換える感じ。

光ニューロモルフィックコンピューティングも、メモリスタなどの電子ニューロモルフィックコンピューティングの代替としてあるよ。光信号を使ってアナログ計算を行う、魅力的な分野だね。例えば: https://www.nature.com/articles/s41566-020-00754-y https://www.nature.com/articles/s44172-022-00024-5 私の理解では、ノイズ信号が大きくなるまでの小さなニューラルネットワークしか計算できないし、フォトニクスでは非常に限られた計算しかうまくいかないみたい。

光ニューロモルフィックコンピューティングの問題は、簡単な部分、つまり行列の掛け算をやってるだけってことなんだ。数十年も前から、イメージングや干渉ネットワークが行列演算を大規模に並列処理できることは分かってた。でも、層間の非線形活性化関数が問題なんだよね。みんなこれを無視してるか、ただ電気に戻しちゃってる(そうするとまた電子機器のコストや帯域幅に制限される)。

記事にプレスリリースへのリンクがあるよ。ここでいくつかの質問に答えてくれるかもね。

ちょっとしたことだけど、この記事のHNのタイトルに、TSMCが協力しているアビセナの名前が入ってたらいいな。

HNのポリシーに反して、タイトルを編集するのはダメだよ。

ちょっと関連があるけど、量子コンピュータにおいて光学的相互接続と統合光学の推進がかなり進んでるよね。この記事が未来に何が起こるかのヒントになるかも。量子コンピュータではレーザーを使わざるを得ないんだ。基本的に、LEDの古典的な光では量子情報を送れないから(ざっくり言うと、LEDは単一の光子じゃなくて、可能な光子数の分布を放出するから、量子レベルでの制御を失う)。さらに、レーザーの狭い線幅が必要なことが多いから、原子と望むように相互作用できるんだ。つまり、不要な原子エネルギーレベルを励起しないようにね。だから、捕らえられたイオンの量子コンピュータでは、レーザー光学の統合を実現しようとみんなが奮闘してるのが見えるよ。チップ内で光をイオンに回折させる回折格子みたいな、よくわからないすごいエンジニアリングを通じてね。数十個以上のイオンを使った捕らえられたイオン量子コンピュータを作りたいなら、これは絶対に克服しなきゃいけない重要な課題だよ。光学的相互接続を通じて複数のコンピュータをネットワーク化するのも代替手段だけど、同じくらい難しい。じゃあ、このIEEEの記事から何を得られるかというと、もしこのLEDのアプローチがうまくいけば、レーザー統合光学のスケールでの失敗を部分的に認めることになると思う。結局、この記事ではレーザーの統合が難しすぎるって主張してるからね。そうなると、量子コンピュータがこの問題を克服するのに苦労するのが見えると思う。まだ研究段階だから、自然の運がどう転ぶか見てみよう。

TSMCのアプローチは理にかなってるけど、量子コンピュータにはあまり関係ないと思う。問題の領域がかなり違うからね。捕らえられたイオンの量子コンピュータは、もっと高価で実用的でないレーザーや光学を使っても役立つことができる。

量子コンピューティングはまだ未来の技術だね。12量子ビットが画期的だって話してる時点で、まだまだ道のりは長いよ。光インターコネクトは量子コンピューティングの問題の中では一番小さい方だし。でも、レーザーが信頼できないって言うのは間違いだね。根本的に間違ってるし、今のプラガブルモジュールのフィールドデータでも支持されてないよ。今、データセンターには何千万ものレーザーがプラガブルモジュールで使われてるからね。それに、LEDは基本的に反射器なしのレーザーの増幅領域だってことも覚えておくといいよ。レーザーがフィールドで失敗する時は、LEDが失敗する理由と同じで、半導体材料への湿気や汚染の侵入が原因なんだ。LEDは量子コンピューティングには役立たないよ。ベルペア(2量子ビット)を作るには、相関した光子を作るためのコヒーレントな光源が必要なんだ。LEDみたいな非コヒーレントな光源から生成される光子は、根本的に相関がないからね。

捕獲イオンや中性原子の量子コンピューティングにはレーザーが必要だよ。光信号がコヒーレントである必要があるからね。これがクラシックなレーザーの主な特徴なんだ。光子の数についての説明はあまり意味がないよ。完璧なレーザーでも、光子の数は確定してないからね。コヒーレント状態は光子の数と位相の両方で本質的に不確かなんだ。でもLEDはもっとひどい。光信号が本当に非コヒーレントだから、良い量子状態ですらないし、量子制御には全く使えないクラシックな非コヒーレント光子の重ね合わせなんだよ。それに、これは完全にオンチップの解決策に見えるね。捕獲イオンや中性原子には、どこかの時点で自由空間光学に移行する必要があるんだ。

この文章は誤解を招くよ。TSMCはアビセナ(問題のスタートアップ)の技術に「ベット」してるわけじゃない。むしろ、アビセナはTSMCに製造を手伝ってもらうためにお金を払ってるみたい。こちらがアビセナのプレスリリースのリンクだよ。過去にこのスタートアップについてIEEE Spectrumにいくつかの記事があったことも指摘しておくけど、ジャーナリストが株を持ってたり、偏見がないことを本当に願ってるよ。