世界を動かす技術を、日本語で。

ジェンマモデルが新たながん治療の可能性を発見する手助けをした

概要

  • Google DeepMindとYale Universityの共同研究による C2S-Scale 27Bモデル の発表
  • 27億パラメータ を持つシングルセル解析用ファウンデーションモデル
  • がん細胞の新しい仮説を生成 し、実験で検証に成功
  • モデルのスケーリングにより 未知の生物学的発見が可能 となることを実証
  • モデルとリソースは 研究コミュニティ向けに公開

C2S-Scale 27B:シングルセル解析の新たな基盤モデル

  • Google DeepMindとYale Universityの共同研究による Cell2Sentence-Scale 27B (C2S-Scale) の発表
  • Gemmaファミリー のオープンモデルを基盤とした設計
  • シングルセルレベルで 細胞の「言語」を理解 するための大規模モデル
  • がん細胞の挙動に関する新規仮説 を生成し、実験で検証
  • AIによる科学研究の新たなマイルストーン の達成

モデルのスケーリングと新規能力の獲得

  • 生物学モデルにも スケーリング則 が適用されることを実証
  • モデルの大型化 により既存タスクの精度向上だけでなく 新たな能力の獲得 が可能
  • 未知の発見や新しいアイデアの創出 がスケーリングの真の価値

C2S-Scale 27Bの動作原理

  • がん免疫療法の課題である 「コールド」腫瘍の「ホット」化 をターゲット
  • 抗原提示の強化 を目的とした条件付き増幅剤の探索
  • デュアルコンテキスト仮想スクリーニング 手法の採用
    • 免疫コンテキスト陽性 :患者由来サンプルと低レベルインターフェロン
    • 免疫コンテキスト中立 :細胞株データと免疫環境なし
  • 4,000種以上の薬剤の効果を両コンテキストでシミュレーションし、 患者関連性の高い薬剤候補を抽出
  • モデルが提案した薬剤のうち 10〜30%は既知、残りは新規発見

予測から実験的検証へ

  • モデルは CK2阻害剤 silmitasertib (CX-4945) に着目
  • 免疫コンテキスト陽性 で強い抗原提示増加を予測、中立では効果なし
  • 新規仮説 として、silmitasertibがMHC-I発現や抗原提示を増強することを示唆
  • 実験では
    • silmitasertib単独:効果なし
    • 低用量インターフェロン単独:控えめな効果
    • 両者併用: 抗原提示が約50%増加
  • in silico予測がin vitroで複数回確認
  • 「コールド」腫瘍を「ホット」にする新たな経路の発見
  • 今後の 新規併用療法の開発に向けた有望なリード

バーチャルスクリーニングによる新しい生物学的発見の設計図

  • C2S-Scale 27Bのような大規模モデル で細胞挙動の予測が可能
  • 高スループット仮想スクリーニング文脈依存型生物学の発見 への応用
  • 生物学的根拠に基づく新規仮説の生成 が現実に
  • Yale Universityのチームは他の免疫環境でも AI予測の検証を進行中
  • さらなる前臨床・臨床検証により新規治療法の加速 に期待

C2S-Scale 27Bの利用開始方法

  • C2S-Scale 27Bモデルとリソース を本日より研究コミュニティ向けに公開
  • bioRxiv にてプレプリント全文を公開
  • Hugging Face でモデルとリソースを閲覧可能
  • GitHub でコードを入手可能
  • 研究者による さらなる発展と生命の言語の解明への貢献 を期待

Hackerたちの意見

こういう技術が、伝統的な安全策や生物兵器の開発を防ぐ国際的な合意を回避するために使われるのが心配だな。

その点について心配してる企業がたくさんあるから、安心して!フロンティアモデルの会社には大きな安全チームがいるし、関連するスキルがあれば応募もできるよ。

技術に関する見出しがどんなにポジティブでも、必ずコメント欄には最悪のシナリオを指摘する人がいるよね。これって何て呼ぶ現象なんだろう?

最近、特に人間に感染しやすいウイルスが研究所から漏れ出して(安全レベルがかなり緩かった - BSL2じゃなくて必要なBSL4だった)、何百万人も死んで世界の半分が shutdown したばかりなんだ。だから、君が言ってる安全策や予防策って何なの? :)

Googleが他の分野で受ける批判は当然だけど、医療や自動運転のためにAIを使って命を救おうとする大きなリソースを投入してるのは評価したい。これって当たり前に思われがちだけど、他の企業はこんな長期的な投資をしてないからね。

誰かがやらなきゃね。大手製薬会社はお金をたくさん持ってるし、AIが人件費を削減できるなら、利益の一部をAI研究に回すつもりだと思うよ。テクノロジー業界全体で資金が枯渇してきてるから、AI企業はバイオテクノロジーや医療といった隣接産業から資金を探さなきゃならないだろうね。

これを知っておくのは大事だと思う。ほかのAI企業が主張したりPRしたりしてることとは裏腹に、科学や人類全体に利益をもたらすためにAIを使うことに対して、実際には内部での取り組みや外部研究者への資金提供も含めて、全く興味がないんだよね。彼らはただデジタルの神を求めてるだけ。だから、科学的応用のあるAI研究には資金が全然足りてない。結果として、機械学習の分野にいる多くの人が、本当はやりたいのに科学的応用には関わってないんだ。

これめっちゃすごい!生物学の分野の人たちがその意義についてコメントしてくれるといいな。

すごいね。でも理想を言うと、このモデルが遺伝子発現の相互作用を予測するために、シンプルな線形モデルよりもどれだけ良いかを示してほしいな。単一細胞の「基盤」モデルの中には、実際にはシリコン上での撹乱モデリングが得意じゃないものもあるから。シンプルな線形モデルの方が優れてることもあるし。この記事を読んで思ったのは、彼らが手に入れたデータセットを使って、標準的な単一細胞RNAシーケンス解析(経路解析を含む)をしたら、この発表された関連性が浮かび上がるのかな?私の予想は、はい…そうなると思う。正しい科学者、正しい計算生物学者、そして正しい質問があればね。ただ、これはTFAの仕事を否定するために言ってるわけじゃないよ。私たちはまだscSeq基盤モデルの初期段階にいるし、その可能性にワクワクしてる。

細胞レベルの計算シミュレーションはずっと前からあったけど、実験データがたくさん集まってきてるおかげで、日々進化してるよね。でも、細胞の活動を推測したり予測したりするには、特定の細胞タイプや生物学的プロセス、環境についての専門知識がめちゃくちゃ必要なんだ。成功するものは大体、人間がキュレーションして検証したもの(文献に基づく大規模な相互作用ネットワークとか)。がんに関しては、実際に臨床で起こることを表現する良い(実験的)モデルが不足してるから、さらに予測が難しいんだよね。単一細胞の解像度があるから、腫瘍間や腫瘍内の異質性によって不確実性も増すし。そうは言っても、基盤モデルは将来のさらなる発展にとって確実に重要だと思う。でも、こういうことがあるから、モデルが大きくなるほど検証プロセスが難しくなるんだよね。

そうだね!

一方で、OpenAIがポルノビジネスに進出してるっていうね。

彼らの研究は性感染症にシフトしてるね。

両方とも同じくらい重要だよ、ただ別の次元でね。

ポルノ産業に関連する人身売買や搾取なしでポルノが楽しめるなら、それも大きな勝利だよね。

驚くべきことに、AIが自力で新しい薬の候補を発見したって言ってる人もいるよ。プレプリントを読んでみたけど(https://www.biorxiv.org/content/10.1101/2025.04.14.648850v2....)、モデルは特定のタスクにだけ焦点を当ててて、同じタスクで他のモデルと比較してないみたい。遺伝子については全然知らないけど、これは重要な進展だと思う。ただ、他のモデルと比較せずに一つのモデルの勝利を主張するのは、ちょっと目を引くための言い回しに感じるな。

誰かが何かを発見しても、他の誰かが理論的にそれを発見できたとしても、何も変わらないってこと?

行こうぜ!!!

私が理解している限り、モデルは人間がすでに行った検索を広げるために使われたみたい。新しい知識を考案したわけじゃないし、ちょっと簡単すぎるかな。でも、問題はこれがどれだけ収穫できるかってことだね。たくさんできるといいな!「簡単すぎる果実」って言葉は、ちょっと違うかも。Googleのモデルは決してバカな技術じゃないから。

この予測がそんなにワクワクしたのは、新しいアイデアだったから。CK2は免疫系の調整因子を含む多くの細胞機能に関与しているとされているけど、シルミタサーティブを使ってCK2を抑制することがMHC-Iの発現や抗原提示を明示的に強化するという文献は報告されていない。これは、モデルが新しい、検証可能な仮説を生み出していて、既知の事実を繰り返しているだけではないことを示している。

AIに関するコメントを読むのはいつも楽しいね。> モデルが新しい知識を考案したわけじゃないし。ちょっと簡単すぎるかも。目標をどんどん変えていくのがね。

新情報!「Excelがピボットテーブルを使って潜在的ながん治療法を発見した」

他のがん治療法の可能性について、2.5pro(この記事で言及されているモデルとは異なる)がアマチュアのがん研究者からの促しで確認したもの: - EPS3.9: 多糖類(深海細菌の糖、発酵可能、IFN-1を誘導)によってピロプトーシスが引き起こされ、IFN-1が生じ、エピトープスプレッディング(増幅効果)を引き起こし、抗がん反応を引き起こす。 - CPMV; 牛エンドウモザイクウイルス(人間には感染しない植物ウイルスだけど、IFN-1(IFN-αと多くのIFN-β)による抗がん反応を引き起こす)。牛エンドウの消費は、近代農業が始まる前は人間にとってもっと一般的だったかもしれないし、牛エンドウは少なくとも何千年も前から人間のがんを治療していたかもしれない。これらの新しい治療法をいくつかの研究者にメールで送ったけど、EPS3.9やCPMVに関連する経路に基づいて治療法が開発されているかどうかはわからない。RNAやmRNAのがんワクチンが開発中だよ。カプシドがないとRNAは到着前に壊れちゃうから、RNAワクチンは通常筋肉内に投与される。私の理解では、一般的なバイオエンジニアリングプラットフォームとして、CPMV牛エンドウモザイクウイルスは、例えばRNAがんワクチンをパッケージするカプシドのように使えるかもしれない。私の理解では、CSC3.9(「強力な抗がん」EPS3.9海洋スポンジバクテリア多糖を生成する)は深海の圧力が必要だけど、環境温度や圧力に近い条件でEPS3.9を生成する代替品をバイオエンジニアリングすることは可能かもしれない。> (CPMV + EPS3.9) + (CPMVprime + mRNA)にはがん治療において利点があるのかな?

時々、GoogleがAIでかなり先を行ってるように感じるけど、私たちが見るのはOpen AIからの平凡なLLMばかり。ほんと、いいものはみんなと共有してない気がする。

OpenAIが言ってる、より優れたモデルがあってそれを提供するにはコストがかかりすぎるっていうのは、なんとなく信じてる。Googleは自分たちが必要だと思うモデルだけを訓練してる感じで、メガモデルみたいなのは作ってないと思うけど、これを正当化する理由は特にない。ただ、彼らは素晴らしいモデルを作るだけの知識はあるから、意味のある意味で遅れてるとは思わないな。

そういう時に、OpenAIみたいなところが出てきて、VCの「エンシティフィケーション」プレイブックを実行するんだよね。