Google DeepMindが「AlphaGenome」を発表

概要

AlphaGenomeは、DNA配列の規制バリアント効果を高精度で予測する新しいAIモデル。最大100万塩基配列の長距離文脈と1塩基レベルの高解像度を両立。多様な分子特性の同時予測と効率的なバリアントスコアリングを実現。非営利研究向けAPIを通じて公開、今後さらなる機能拡張も計画。疾患理解・合成生物学・基礎研究の加速に貢献する可能性。

AlphaGenome：次世代DNA配列予測AIの登場

AlphaGenome は、ヒトDNA配列の バリアントや変異 が遺伝子調節に与える影響を高精度に予測する AIツール。
最大 100万塩基（base-pair） の長大なDNA配列を入力し、数千種類の 分子特性 を予測。
変異配列と非変異配列の予測値を比較し、バリアントの 影響スコアを効率的に算出。
予測対象には、 遺伝子の開始・終了位置、スプライシング、RNA産生量、DNAのアクセス性やタンパク質結合部位 など多岐にわたる分子情報を含む。
ENCODE、GTEx、4D Nucleome、FANTOM5 などの公的コンソーシアムデータを活用し、ヒト・マウスの多様な細胞種・組織をカバー。

AlphaGenomeの技術的特徴

長大配列×高解像度 ： 100万塩基の文脈 を 1塩基単位 で解析、遠隔調節領域と微細な生物学的特徴の同時把握が可能。
従来モデルの課題 （配列長と解像度のトレードオフ）を解決し、計算資源も効率化。
多様なモダリティの同時予測 ：遺伝子調節の複雑な階層構造を 一括で解析。
バリアント影響の高速スコアリング ：変異の全分子特性への影響を 数秒で評価。
新規スプライスジャンクション推定 ：スプライシング異常による 希少疾患 の分子機序解明に貢献。
評価ベンチマークで最高性能 ：既存モデルを 22/24タスクで上回り、バリアント効果予測も 24/26タスクで首位。
Enformer、AlphaMissenseとの補完性 ：全ゲノム（コーディング2%、ノンコーディング98%）の包括的解釈を実現。

AlphaGenomeの研究応用例

疾患研究 ：遺伝子変異の機能的影響を高精度に予測、 希少疾患や複雑疾患の原因解明、新規治療標的の探索。
合成生物学 ：特定細胞種でのみ遺伝子を活性化する 合成DNA設計 のガイド。
基礎研究 ：ゲノムの 重要機能要素のマッピング や細胞種特異的調節ネットワークの解明。
実例：T-ALL（T細胞性急性リンパ芽球性白血病）の 非コーディング変異 がTAL1遺伝子を活性化する分子機序を予測、既知の疾患メカニズムと整合。

AlphaGenomeの現時点での制限

10万塩基以上離れた遠隔調節要素 の影響把握は未解決課題。
細胞種・組織特異的パターン の予測精度向上が今後の課題。
個人ゲノム全体の予測 には未対応、個別バリアントの機能解析に特化。
複雑形質や疾患の全体像 （発生・環境要因など）はモデルの直接的な射程外。
継続的なモデル改良とコミュニティからの フィードバック収集 を重視。

コミュニティへの公開と今後の展望

AlphaGenome API を通じて 非営利研究用途で公開。
予測結果は 研究目的限定 で、 臨床利用には未検証。
利用希望者は コミュニティフォーラム で事例・質問・フィードバックの共有が可能。
今後は 機能拡張、他種ゲノム対応、追加モダリティの導入 も視野に。
科学コミュニティと連携し、 ゲノム理解と創薬、ヘルスケアの新発見 を加速。

参考情報・謝辞

AlphaGenome preprint、 API利用案内、 コミュニティフォーラム で詳細情報を提供。
本研究は多数の共同著者・協力者の貢献によるもの。

Hackerたちの意見

2008年にGoogleで働き始めたとき、生物科学にかなりのリソースを投入することをすぐに提唱したんだ（DMが生物学に取り組み始めるずっと前の話）。Googleには、世界トップクラスの結果を示すために必要なデータ処理や機械学習の能力があると思ったから。これが他の生物学者たちにも技術を再現する手助けになるといいなと思ってた。いくつか進展があったよ。exacycleを使って、タンパク質の折りたたみや設計に関するエキサイティングな結果を示したり、後にはCloud Genomicsを立ち上げて大規模なデータセットを保存・処理するための分析を行ったりした。しばらく前にGoogleを離れたけど（Sundarは本当にインスピレーションを与えてくれないリーダーだし）、DeepMindに移ることもできなかった。でも、彼らが自分の目標を自分よりずっと上手く実行しているのを見るのは嬉しい。何十年も温めてきたアイデアがやっと形になってきて、これが生物学の大発見につながることを願ってる。この最新の研究がコミュニティに受け入れられるには時間がかかるだろうね。論文をざっと読んだけど、すごい量の情報が詰まってる。

└

何十年も温めてきたアイデアがやっと形になってきて嬉しいよきっとあなたは賢い人なんだろうし、すごく新しいアイデアを持ってたんだろうけど、あなたの返事はちょっと傲慢に聞こえるよ。私たちの多くもアイデアを持ってるし、印象的なものもある（例えば「LLMを使って世界の飢餓や貧困、孤独を解決し、資本主義を修正しよう」なんてね）。でも、「やっと！私のアイデアが注目されてる」って言うのはちょっと変だよね。

└

Sundarは本当にインスピレーションを与えてくれないリーダーだねそれはわかるけど、彼はGoogleを現金製造機にしたんだ。2015年に彼がCEOになる前の四半期、Googleは約30億の四半期利益を上げてた。2025年第1四半期は350億だよ。これだけの規模で10倍の利益成長って、前例がないし、数字自体がインスピレーションを与えてる。彼の仕事だよ。確かにミスもしたけど、Googleの主力である広告にこだわって、それが実を結んだ。AIへの移行は遅れたけど、Geminiは全体的にすごく競争力がある。DeepMindも素晴らしい成果を上げてる。SundarはSamやCookのような盛り上げ役ではないけど、結果を出してる。個人的には彼は過小評価されてると思う。

└

サンタクルーズのシャトルに乗ったことある？ずいぶん前にこの話をしたかもしれないね。当時はすごくワクワクしたし、今もAlphaGenomeで同じように感じるよ。

この分野で最大の問題の一つ、すなわち、高度に相関したDNAのローカス間で因果的変異と非因果的変異を区別することを無視しているのが残念だった。遺伝学用語で言うと、これはファインマッピングと呼ばれる。次のバージョンで取り上げられるかもしれないけど、重要な調節領域をターゲットにした効果的な薬を設計するためには本当に大事なことだよ。最近、Natureにこの問題の興味深い例が発表されて、自動免疫におけるマクロファージ機能を調整するための面白い薬の候補が出てきたよ。: https://www.nature.com/articles/s41586-024-07501-1

└

これで近づけるのかな？あまり詳しくないけど、機能的な予測が良くなると、実際に重要な変異とただの付随的なものを見分けやすくなる気がする。ステップ2は、これを適切な統計的ファインマッピング手法と統合することかな？

自然に、（AI生成の？）ヒーロー画像は主要な溝と副溝をちゃんと描写できてないね。 :-)

└

なのに、まだ4MBもデータがあるんだよね。

└

知りたい人はこちら: https://www.mun.ca/biology/scarr/MGA2_02-07.html

これは本当に面白い問題だね。入力サイズを3.2Gbp、人間のゲノムのサイズに拡大することを想像してみて。今まで考えられなかった相互作用が起きるかもしれないな。それに、最近はすべてがU-netやトランスフォーマーに関わってるのも面白い。

└

最近はU-netやトランスフォーマーがすごく注目されてるよね。ハンマーを持った人には、何でもハンマーに見えるって感じかな…

RNA予測が大きく進展してるから、mRNAラボにとってはいいニュースかもね。

└

アメリカ以外の人には特に…

DMだけが高インパクトなAIアプリケーションの研究をしてるわけじゃないと思うけど、彼らは本当に目立ってるよね。なんでだろう？それとも、彼らの技術マーケティングが他より優れてるだけ？

└

これはよくできた研究だけど、革命的ってわけじゃないね。似たようなことはずっと前からやってる人たちがいるし…

"Release"にはもう少し文脈が必要かもね。人によって意味が全然違うから。 > AlphaGenomeは、http://deepmind.google.com/science/alphagenome のオンラインAPIを通じて非商用利用が可能になるよ。つまり、要するにこの論文は新しいGoogleサービスのセールスピッチってことだね。

ハクソク