概要
AlphaGenomeは、DNA配列の規制バリアント効果を高精度で予測する新しいAIモデル。 最大100万塩基配列の長距離文脈と1塩基レベルの高解像度を両立。 多様な分子特性の同時予測と効率的なバリアントスコアリングを実現。 非営利研究向けAPIを通じて公開、今後さらなる機能拡張も計画。 疾患理解・合成生物学・基礎研究の加速に貢献する可能性。
AlphaGenome:次世代DNA配列予測AIの登場
- AlphaGenome は、ヒトDNA配列の バリアントや変異 が遺伝子調節に与える影響を高精度に予測する AIツール。
- 最大 100万塩基(base-pair) の長大なDNA配列を入力し、数千種類の 分子特性 を予測。
- 変異配列と非変異配列の予測値を比較し、バリアントの 影響スコアを効率的に算出。
- 予測対象には、 遺伝子の開始・終了位置、スプライシング、RNA産生量、DNAのアクセス性やタンパク質結合部位 など多岐にわたる分子情報を含む。
- ENCODE、GTEx、4D Nucleome、FANTOM5 などの公的コンソーシアムデータを活用し、ヒト・マウスの多様な細胞種・組織をカバー。
AlphaGenomeの技術的特徴
- 長大配列×高解像度 : 100万塩基の文脈 を 1塩基単位 で解析、遠隔調節領域と微細な生物学的特徴の同時把握が可能。
- 従来モデルの課題 (配列長と解像度のトレードオフ)を解決し、計算資源も効率化。
- 多様なモダリティの同時予測 :遺伝子調節の複雑な階層構造を 一括で解析。
- バリアント影響の高速スコアリング :変異の全分子特性への影響を 数秒で評価。
- 新規スプライスジャンクション推定 :スプライシング異常による 希少疾患 の分子機序解明に貢献。
- 評価ベンチマークで最高性能 :既存モデルを 22/24タスクで上回り、バリアント効果予測も 24/26タスクで首位。
- Enformer、AlphaMissenseとの補完性 :全ゲノム(コーディング2%、ノンコーディング98%)の包括的解釈を実現。
AlphaGenomeの研究応用例
- 疾患研究 :遺伝子変異の機能的影響を高精度に予測、 希少疾患や複雑疾患の原因解明、新規治療標的の探索。
- 合成生物学 :特定細胞種でのみ遺伝子を活性化する 合成DNA設計 のガイド。
- 基礎研究 :ゲノムの 重要機能要素のマッピング や細胞種特異的調節ネットワークの解明。
- 実例 :T-ALL(T細胞性急性リンパ芽球性白血病)の 非コーディング変異 がTAL1遺伝子を活性化する分子機序を予測、既知の疾患メカニズムと整合。
AlphaGenomeの現時点での制限
- 10万塩基以上離れた遠隔調節要素 の影響把握は未解決課題。
- 細胞種・組織特異的パターン の予測精度向上が今後の課題。
- 個人ゲノム全体の予測 には未対応、個別バリアントの機能解析に特化。
- 複雑形質や疾患の全体像 (発生・環境要因など)はモデルの直接的な射程外。
- 継続的なモデル改良とコミュニティからの フィードバック収集 を重視。
コミュニティへの公開と今後の展望
- AlphaGenome API を通じて 非営利研究用途で公開。
- 予測結果は 研究目的限定 で、 臨床利用には未検証。
- 利用希望者は コミュニティフォーラム で事例・質問・フィードバックの共有が可能。
- 今後は 機能拡張、他種ゲノム対応、追加モダリティの導入 も視野に。
- 科学コミュニティと連携し、 ゲノム理解と創薬、ヘルスケアの新発見 を加速。
参考情報・謝辞
- AlphaGenome preprint、 API利用案内、 コミュニティフォーラム で詳細情報を提供。
- 本研究は多数の共同著者・協力者の貢献によるもの。