ジェンマモデルが新たながん治療の可能性を発見する手助けをした

2025年10月16日原文(blog.google)

概要

Google DeepMindとYale Universityの共同研究による C2S-Scale 27Bモデル の発表
27億パラメータ を持つシングルセル解析用ファウンデーションモデル
がん細胞の新しい仮説を生成 し、実験で検証に成功
モデルのスケーリングにより 未知の生物学的発見が可能 となることを実証
モデルとリソースは 研究コミュニティ向けに公開

C2S-Scale 27B：シングルセル解析の新たな基盤モデル

Google DeepMindとYale Universityの共同研究による Cell2Sentence-Scale 27B (C2S-Scale) の発表
Gemmaファミリー のオープンモデルを基盤とした設計
シングルセルレベルで 細胞の「言語」を理解 するための大規模モデル
がん細胞の挙動に関する新規仮説 を生成し、実験で検証
AIによる科学研究の新たなマイルストーン の達成

モデルのスケーリングと新規能力の獲得

生物学モデルにも スケーリング則 が適用されることを実証
モデルの大型化 により既存タスクの精度向上だけでなく 新たな能力の獲得 が可能
未知の発見や新しいアイデアの創出 がスケーリングの真の価値

C2S-Scale 27Bの動作原理

がん免疫療法の課題である 「コールド」腫瘍の「ホット」化 をターゲット
抗原提示の強化 を目的とした条件付き増幅剤の探索
デュアルコンテキスト仮想スクリーニング 手法の採用
- 免疫コンテキスト陽性 ：患者由来サンプルと低レベルインターフェロン
- 免疫コンテキスト中立 ：細胞株データと免疫環境なし
4,000種以上の薬剤の効果を両コンテキストでシミュレーションし、 患者関連性の高い薬剤候補を抽出
モデルが提案した薬剤のうち 10〜30%は既知、残りは新規発見

予測から実験的検証へ

モデルは CK2阻害剤 silmitasertib (CX-4945) に着目
免疫コンテキスト陽性 で強い抗原提示増加を予測、中立では効果なし
新規仮説 として、silmitasertibがMHC-I発現や抗原提示を増強することを示唆
実験では
- silmitasertib単独：効果なし
- 低用量インターフェロン単独：控えめな効果
- 両者併用： 抗原提示が約50%増加
in silico予測がin vitroで複数回確認
「コールド」腫瘍を「ホット」にする新たな経路の発見
今後の 新規併用療法の開発に向けた有望なリード

バーチャルスクリーニングによる新しい生物学的発見の設計図

C2S-Scale 27Bのような大規模モデル で細胞挙動の予測が可能
高スループット仮想スクリーニング や 文脈依存型生物学の発見 への応用
生物学的根拠に基づく新規仮説の生成 が現実に
Yale Universityのチームは他の免疫環境でも AI予測の検証を進行中
さらなる前臨床・臨床検証により新規治療法の加速 に期待

C2S-Scale 27Bの利用開始方法

C2S-Scale 27Bモデルとリソース を本日より研究コミュニティ向けに公開
bioRxiv にてプレプリント全文を公開
Hugging Face でモデルとリソースを閲覧可能
GitHub でコードを入手可能
研究者による さらなる発展と生命の言語の解明への貢献 を期待

Hackerたちの意見

こういう技術が、伝統的な安全策や生物兵器の開発を防ぐ国際的な合意を回避するために使われるのが心配だな。

└

その点について心配してる企業がたくさんあるから、安心して！フロンティアモデルの会社には大きな安全チームがいるし、関連するスキルがあれば応募もできるよ。

└

技術に関する見出しがどんなにポジティブでも、必ずコメント欄には最悪のシナリオを指摘する人がいるよね。これって何て呼ぶ現象なんだろう？

└

最近、特に人間に感染しやすいウイルスが研究所から漏れ出して（安全レベルがかなり緩かった - BSL2じゃなくて必要なBSL4だった）、何百万人も死んで世界の半分が shutdown したばかりなんだ。だから、君が言ってる安全策や予防策って何なの？ :)

Googleが他の分野で受ける批判は当然だけど、医療や自動運転のためにAIを使って命を救おうとする大きなリソースを投入してるのは評価したい。これって当たり前に思われがちだけど、他の企業はこんな長期的な投資をしてないからね。

└

誰かがやらなきゃね。大手製薬会社はお金をたくさん持ってるし、AIが人件費を削減できるなら、利益の一部をAI研究に回すつもりだと思うよ。テクノロジー業界全体で資金が枯渇してきてるから、AI企業はバイオテクノロジーや医療といった隣接産業から資金を探さなきゃならないだろうね。

└

これを知っておくのは大事だと思う。ほかのAI企業が主張したりPRしたりしてることとは裏腹に、科学や人類全体に利益をもたらすためにAIを使うことに対して、実際には内部での取り組みや外部研究者への資金提供も含めて、全く興味がないんだよね。彼らはただデジタルの神を求めてるだけ。だから、科学的応用のあるAI研究には資金が全然足りてない。結果として、機械学習の分野にいる多くの人が、本当はやりたいのに科学的応用には関わってないんだ。

これめっちゃすごい！生物学の分野の人たちがその意義についてコメントしてくれるといいな。

└

すごいね。でも理想を言うと、このモデルが遺伝子発現の相互作用を予測するために、シンプルな線形モデルよりもどれだけ良いかを示してほしいな。単一細胞の「基盤」モデルの中には、実際にはシリコン上での撹乱モデリングが得意じゃないものもあるから。シンプルな線形モデルの方が優れてることもあるし。この記事を読んで思ったのは、彼らが手に入れたデータセットを使って、標準的な単一細胞RNAシーケンス解析（経路解析を含む）をしたら、この発表された関連性が浮かび上がるのかな？私の予想は、はい…そうなると思う。正しい科学者、正しい計算生物学者、そして正しい質問があればね。ただ、これはTFAの仕事を否定するために言ってるわけじゃないよ。私たちはまだscSeq基盤モデルの初期段階にいるし、その可能性にワクワクしてる。

└

細胞レベルの計算シミュレーションはずっと前からあったけど、実験データがたくさん集まってきてるおかげで、日々進化してるよね。でも、細胞の活動を推測したり予測したりするには、特定の細胞タイプや生物学的プロセス、環境についての専門知識がめちゃくちゃ必要なんだ。成功するものは大体、人間がキュレーションして検証したもの（文献に基づく大規模な相互作用ネットワークとか）。がんに関しては、実際に臨床で起こることを表現する良い（実験的）モデルが不足してるから、さらに予測が難しいんだよね。単一細胞の解像度があるから、腫瘍間や腫瘍内の異質性によって不確実性も増すし。そうは言っても、基盤モデルは将来のさらなる発展にとって確実に重要だと思う。でも、こういうことがあるから、モデルが大きくなるほど検証プロセスが難しくなるんだよね。

そうだね！

一方で、OpenAIがポルノビジネスに進出してるっていうね。

Hacker Newsで議論の続きを見る

ハクソク