世界を動かす技術を、日本語で。

CERNがシリコンに埋め込まれた小型AIモデルを使用してLHCデータのリアルタイムフィルタリングを行う

概要

  • CERNは 超小型AIモデル を独自のシリコンチップに実装し、LHCの膨大なデータをリアルタイムで選別
  • データ量は 年40,000エクサバイト、全インターネットの約1/4規模
  • FPGA/ASIC 上で動作するAIがナノ秒単位で重要イベントを選別
  • 今後の HL-LHC 対応に向け、AIハードウェアパイプラインも進化中
  • このアプローチは 極小・高効率AI の実用例として他分野にも波及可能性

LHCのデータ処理課題とAI活用

  • Large Hadron Collider(LHC)は 年間約40,000エクサバイト もの生データを生成
  • ピーク時のデータストリームは 毎秒数百テラバイト に達し、現存のストレージや計算機での全保存・処理は不可能
  • 検出器レベルで 瞬時に科学的価値の高い衝突イベントを選別 し、残りを即座に廃棄する必要
  • このリアルタイム選別は 現代科学で最も過酷な計算課題 のひとつ

ハードウェア組込みAIモデルの特徴

  • 従来の GPU/TPUベースAI ではなく、 超小型・高最適化AIモデル を独自開発
  • モデルは FPGAやASIC に直接実装され、検出器のエッジで ナノ秒単位の推論 を実現
  • HLS4ML などのオープンソースツールでPyTorch/TensorFlowモデルをC++に変換し、ハードウェア化
  • ニューラルネット層以外にも 膨大な事前計算済みルックアップテーブル を搭載
    • 典型的な入力パターンへの応答を即時出力し、浮動小数点演算を極力回避
  • この ハードウェア最優先設計 が、極限の低遅延動作を可能に

LHCトリガーシステムの構成

  • 最初の選別段階( Level-1 Trigger)は 約1,000台のFPGA で構成
    • 各FPGAで AXOL1TLアルゴリズム が動作し、50ナノ秒未満でイベント判定
    • 科学的価値が高いと判断された0.02%のみが次段階へ
  • 次段階( High-Level Trigger)は 25,600 CPU+400 GPU の計算ファーム
    • 1日あたり約1ペタバイトの価値あるデータにまで絞り込み

今後の展望:HL-LHCへの対応

  • LHCは2031年から High-Luminosity LHC(HL-LHC) へ大幅アップグレード予定
    • 衝突ごとのデータ量が 10倍以上 に増加
  • CERNは 次世代超小型AIモデル やFPGA/ASIC実装の最適化を進行中
  • リアルタイムトリガーシステム全体 の強化で、今後も極限の低遅延性能維持を目指す
  • データ規模増大に対応し、 粒子物理学の新発見 を支える基盤構築

インパクトと他分野応用可能性

  • 世界的なAI業界が 巨大モデル・高消費電力路線 を追う中、CERNは 極小・高効率AI を志向
  • LHCのトリガーシステムは「 Tiny AI」の現場実装例として注目
    • 汎用AIアクセラレータでは実現困難な ナノ秒レベルの推論性能 を実現
  • この手法は 自律システム、高頻度取引、医用画像、航空宇宙 など他分野のリアルタイムAIにも波及可能性
  • 計算資源と電力効率 への世界的需要増加に対し、モデル巨大化とは逆の 極限特化・ハードウェア最適化 の価値を提示

参考文献・ソース

  • CERN Twiki: AXOL1TL V5アーキテクチャと実装詳細 https://twiki.cern.ch/twiki/bin/view/CMSPublic/AXOL1TL2025
  • arXiv論文: CMS実験のL1トリガーにおけるリアルタイム異常検出 https://arxiv.org/abs/2411.19506
  • CERN公式: LHCデータ処理とトリガーシステム https://home.cern/science/computing
  • Thea Aarrestad講演: LHCトリガー向けTiny AI/MLの概要 https://www.youtube.com/watch?v=T8HT_XBGQUI https://www.youtube.com/watch?v=8IZwhbsjhvE

Hackerたちの意見

関連があるかも: https://www.youtube.com/watch?v=T8HT_XBGQUI (CERN LHCにおけるビッグデータとAI、Dr. Thea Klaeboe Aarrestadによる) https://www.youtube.com/watch?v=8IZwhbsjhvE (ゼタバイトから貴重なイベントへ: 大型ハドロン衝突型加速器におけるナノ秒AI、Thea Aarrestadによる) ページ: https://www.scylladb.com/tech-talk/from-zettabytes-to-a-few-...

ここでのAIの言葉遣いはちょっと誇張気味だね。これは機械学習で得たハードコーディングされたロジックのチップと呼べるかも。

LLMのロジックは機械学習から導き出された重みなの?

AIは新しいものじゃないし、機械学習で得たロジックも確実にAIにカウントされるよ。

MLはAIの一部で、昔からそうだよ。AIはChatGPTと同じじゃないし、AIって言葉は2022年11月に生まれたわけじゃない。

彼らはオートエンコーダーを使ったカスタムニューラルネットを使ったんだ。畳み込み層も含まれてる。過去の実験データでトレーニングしたんだって。 https://arxiv.org/html/2411.19506v1 なんでAIアルゴリズムや技術を詳しく説明するのがこんなに難しいんだろう?この記事がもっと良くなったはずなのに。

今のサイクルでは「AIモデル」が「線形回帰」の代わりに使われるのを半分期待してるよ。

今のハイプサイクルに合わないから、LLMじゃなきゃダメだよね。全部AIって呼ぶと、株価も上がるし。

実装のほとんどはFPGAみたいだけど、それを「シリコンに物理的に焼き付けられた」って言うのはちょっと言い過ぎじゃない?

それはLLM Uber Allesとは合わないからね。

これを見つけてくれてありがとう。いわゆる技術的な記事が実際の技術を省略してると、私もイライラするよ。

すごく重要だね!これは最近AIと呼ばれることが多いLLMとは違うよ。FPGAの中のニューラルネットワークなんだから。

FPGA じゃあ「シリコンに焼き付けられてる」わけじゃないの?記事にはFPGAとASICについて触れてるけど、ちょっと曖昧だね。ASICがここで意味を持つとは思えないな。

LLM企業のマーケティングがうまくいったってことだね。俺も真っ先にそれを思い浮かべたし。

極端ではないけど、コーヒーメーカーの中には小さなCNNベースのモデルを使ってるのもあるよ。コーヒーメーカーには小さくて安いカメラが組み込まれてて、そのモデルは3つのことをやってるんだ:(1) 容器の種類を分類してコーヒーの種類を選ぶ、(2) 画像セグメンテーション - カップや穴の位置を特定する、(3) 回帰 - 容量を測定してどれくらいコーヒーを注ぐかを調整する。

FPGAが「シリコンに焼き付けられる」ってどういうこと?CERNでASICがテープアウトされてるなんて初耳だわ。

誰か他の人にやらせることはできないのかな?

実際、CERNは他の目的のためにカスタムASICを設計してるよね: https://indico.cern.ch/event/1115079/contributions/4693643/a... (でも、これは多分関係ないと思うけど。)

みんなの考え深いコメントとリンク、ほんとに感謝!高品質なフィードバックが嬉しかった。記事を実際のVAEベースのAXOL1TLアーキテクチャ(異常検出用の変分オートエンコーダ)を反映するように更新したよ。arXivの論文とThea Aarrestadのトークも主要な情報源に追加した。

ついでに言うと:> これらの極端な要求を満たすために、CERNは意図的に従来のGPUやTPUベースの人工知能アーキテクチャから離れました。これもあんまり正しくないよ:CERNは今まで以上に多くのGPUを使ってるから。データ処理にはいくつかのステップがあって、物理学者たちはうまくいくとCOTSのGPUやCPUを買うのを喜んでるんだ。

みんなにお知らせだよ、今のCPUを使ってる人はみんなこれを使ってる。分岐予測にパーセプトロンを使ってるんだ。

今のところ、AIって基本的に「問題を解決する方法が分からなかったから、ただのブラックボックスを投げただけ」って意味になってるよね。

それは知らなかった!もっと詳しく知るための参考文献とかある?どうやってアーキテクトしてトレーニングするのか気になるな。

これが精神だね。私も似たようなことをやってるよ:1.8Tの論理システムを予算のモバイルデバイスを使ってスケールアップしてる。今日、537クローンに到達したよ。論理の構造が全てで、CPUパワーじゃないんだ。

初めてのインターンシップ、1989年の夏にCERNで、オパールLEPCピットで働いてた。FORTRANでオフラインデータフィルタリングプログラムを書いたんだ。懐かしいな。