概要
- Deep learning による酵素機能予測研究の 華やかさ と、その裏での検証作業の評価の低さ
- Transformerモデルを用いた論文が Nature に掲載され、非常に高い注目を集めた事例
- その後、重大なエラーを指摘した bioRxiv の論文は注目度が低い現実
- AIの生物学応用における 専門知識の重要性 と、現行出版インセンティブの問題点
- 機械学習結果の 正当性評価の難しさ と、今後の課題
AIによる酵素機能予測と出版インセンティブの歪み
- Deep learning は華やかで高く評価される分野
- Transformerモデルを用いて 2,200万件の酵素データ で訓練・評価し、 450種の未知酵素の機能予測 を実施
- 結果は Nature 誌に掲載、 Altmetric上位5% の注目度を記録
- 他者の研究の誤りを検証し指摘した論文は bioRxiv に投稿されるも、ほとんど注目されず
- AI研究の成果発表と 地道な検証作業 との評価格差
酵素機能決定の難しさ
- 酵素は生命活動に不可欠な 触媒 であり、機能分類には Enzyme Commission (EC)番号 が利用される
- アミノ酸配列 からEC番号(機能)を予測することは機械学習に適した課題
- UniProt などに2,200万件以上の酵素データが蓄積
- Transformerモデルは BERT由来の構造 (2層エンコーダ、2層CNN、線形層)を採用
- モデルは未知酵素に対し約450件の新規機能を予測し、うち3件を in vitro で検証
重大な予測エラーの発覚
- Nature論文 のTransformerモデルは 多数の誤った予測 を生成
- テストセット上では高精度だが、 データリーク の疑いも指摘
- 未知酵素の予測結果の多くが 既知データの再発見 や 生物学的に不合理な繰り返し、 誤ったパラログ であった
- 例:E. coliの YjhQ がmycothiol合成酵素と予測されるが、E. coliはmycothiolを合成しない
- 135件 は既知、 148件 は不自然な繰り返し、他にも文献や生物学的知見と矛盾する例多数
専門家による誤りの発見
- in vitro検証対象となった yciO は、Dr. de Crécy-Lagardによって10年以上前から研究されていた
- yciOとTsaCは進化的に関連するが、 機能は異なる ことが既に証明済み
- yciOはTsaCの機能を補完できず、活性もTsaCの1万分の1以下
- 構造類似性だけでなく、 遺伝子周辺情報、基質ドッキング、経路内共存関係 など複数の証拠が必要
機械学習モデルの限界と真の未知
- 酵素機能予測には
- 既知ラベルの伝播
- 本当に未知の機能の発見 という異なる課題が混在
- 教師あり学習モデル は本質的に「真の未知」には対応できない
- ラベル伝播の失敗や誤伝播、データベース側の誤り、実験ミスなど多様なエラー
- 誤った機能情報 が主要データベースに蓄積・伝播するリスク
データワークの重要性と評価の不均衡
- AIモデル構築よりも データ検証 や専門知識の統合が評価されにくい現状
- “Everyone Wants to do the Model Work, not the Data Work”論文でも ドメイン知識不足 がAI失敗の主因と指摘
- 多くのAI論文で 専門家による綿密な検証 が行われていない現実
- 地道な検証作業こそが科学の進歩には不可欠
- 派手なAI研究偏重 のインセンティブ構造を是正し、 多角的な研究投資 の必要性を強調
まとめと今後への提言
- AIの生物学応用には 深い専門知識 と 多面的な検証 が不可欠
- 出版・評価システム の見直しと、地道な検証研究へのインセンティブ強化
- 誤ったデータの伝播防止と、 質の高い科学的成果 の担保
- 研究資金配分の見直しと、 多様な研究アプローチ の価値再評価