世界を動かす技術を、日本語で。

2,000ドル未満でDNAをシーケンスする方法

概要

  • 個人レベル でのDNAシーケンス体験の記録
  • Oxford Nanopore MinION を使った自宅実験の詳細
  • 機材・手順・コスト の具体的な説明
  • 実際のシーケンス結果と 課題・反省点
  • DNA解析技術の進化 の簡単な歴史紹介

自宅でのDNAシーケンス体験

  • 指先の採血 に苦戦しつつも、必要な血液量(200µL)の確保
  • Oxford Nanopore MinION スターターキット(約$1,000)を中心とした機材構成
    • MinION本体、フローセル、試薬一式
    • Zymo DNA抽出キット(無料サンプル)
    • Amazonで購入したミニ遠心機($50)
    • ラボ消耗品(エッペンドルフチューブ、ランセット、ピペット等、$50)
    • サーマルサイクラーの代用として 電気ケトル +バケツ+発泡スチロール($20)
  • 合計コスト:約$1,100

DNAシーケンスの大まかな流れ

  • 血液サンプルの採取
  • 白血球からDNA抽出 (赤血球にはDNAがないため)
    • Zymoキット付属の酵素とフィルター付きチューブを使用
  • DNA前処理 (ナノポアが読み取れる状態へアダプター分子を付加)
  • MinIONフローセルへDNA投入
    • USB接続し、MinKNOWソフトでリアルタイム解析
  • ベースコーリング (電気信号→塩基配列予測)

DNAシーケンス技術の進化

  • Sanger法時代(1960-2003)
    • 欠陥ヌクレオチドでDNA複製を停止させ、電気泳動で分離
    • ヒトゲノム解読に13年・23億ドル
  • Illumina時代(2005-2010年代)
    • 合成による並列シーケンス技術
  • ナノポア時代(現代)
    • 一本鎖DNAをナノスケールの穴に通し、電気信号で塩基を判別
    • DNA断片の切断不要

実験結果と課題

  • 2回のランで約1ギガベース (ヒトゲノムの約13%)のシーケンスに成功
  • 75%がヒトDNA、25%が細菌汚染
  • SNP解析 (例:乳糖耐性遺伝子や乳がん遺伝子)にはカバレッジ不足
    • 各領域のリード数が少なく、信頼性に欠ける
  • フローセルの不調 (2048穴のうち623穴しか機能せず)
  • それでも $1,100でヒトゲノムの一部解読に成功 という成果

まとめ・謝辞

  • 個人でも工夫次第でDNA解析が可能 な時代
  • 技術的・倫理的課題(汚染、データの信頼性、個人情報管理)も多い現状
  • 実験協力者 (Lenni, Cece, S)への感謝

この体験記は、 DIYバイオパーソナルゲノミクス に関心のある方にとって、現実的なハードルや楽しさ、課題を知る貴重なレポートです。

Hackerたちの意見

NebulaとDanteはこれを約300ドルでやってくれるよ。どのベースでも30倍のカバレッジが得られるし、もう少しお金を出せば100倍のカバレッジも可能だよ。1000ドルのゲノムは、もう10年以上前からあったんだ。

そうそう、ここでの違いは1000ドルのタグが「スケール価格」ってこと。複数のシーケンシングを行って、反応セットを使うことでその価格に達するんだ。

これを試してみたかったんだけど、Nebulaについてもう少し調べてみたんだ。Nebulaは、どうやらMetaやMicrosoft、Googleに詳細なゲノムデータを開示したことで集団訴訟を受けているみたい。サブレディットには、キットを返送してから何年も結果が届かなかった人たちの報告がいっぱいあるし、DTCゲノムテスト全般でシーケンシングの質や偽陽性についての懸念もある。23andmeの件もあったし、私の遺伝子データをどのプライベート企業にも送るのはちょっと怖いな。

でもそうなると、基本的に誰かがあなたの遺伝子データの所有権を持つことになって、彼らの「正当な利益」の文脈で何でもできる権利を得ることになるんだよね。それに、その会社がハッキングされたり売却されたりする可能性もあるし、実際にそうなった会社もあるからね。

NebulaやDanteはBAMを提供してるの?それともVCFだけ?

sequencing.comはどう?

ちなみに、$2,000の請求書にはDNA抽出機器とシーケンサー自体が含まれてるよ。Nebulaとかが使ってるシーケンサーは、たぶん100万ドル以上だね。もっと安くしたいなら、WGSの代わりにエクソームを選ぶこともできる。多くの人がシーケンシングしてるけど、実際にはジェノタイピングがしたいだけなんだよね。でも、誰かがすでに$100でWGSを受けてるって聞いても驚かないよ。

残念ながら、1000ドルの「MinIONスターターキット」はもう入手できないみたい。記事のリンクをたどると404ページに行っちゃうし、フローセル付きの最安のMinIONデバイスは今4950ドルになってるよ。

記事は2日前に投稿されたよ…

面白いコンセプトだけど、壊れたハードウェアと、何も役に立つものを得る前に諦めちゃった感じで、この記事はちょっと残念だったな。>「もう一つの問題は、フローセルが最初から故障していたことです — 2048個の孔のうち623個しか動いていませんでした。これは機械にとって普通のことなの? 一度の試みで諦めなかったところの詳しい説明はどこかにないの?」

サンプルによるね。通常は少なくとも1200はあるけど、800は保証されてるから、もしかしたら返金を求めることもできるかも。

こんにちは、信じられないかもしれないけど、実際に著者たちが試みていたことをやったことがあるんだ。血液の代わりに唾液をDNAのソースとして使って、Qiagenのキットで抽出したんだ。俺のナノポアフローセルは、最初からほぼ全てのポアが動いてたから、これは普通じゃないと思う。もしかしたら、保管方法が間違ってたのかもね。

ほとんどの分析手法と同じように、サンプルの準備が重要だよね。高品質な結果を得るには、丁寧なサンプル準備が必要で、そうすることで分析プロセスが最適に進むんだ。

この機械は普通なの? いや、「普通」ではないけど、結構一般的だよ。私がNGSで働いていたとき、フローハセルの約1/4がダメだった。

これは「これを試したらどうなるか」という意味で結構面白かったと思う。ネガティブな結果もいいよね。技術的な問題が多いのは、遺伝子系譜の少ない経験から予想してたけど。

著者たちは、シーケンシング中にアクティブなポアの数を見て、非アクティブなものには製造欠陥があると誤解したんじゃないかな。私の経験では、ほとんどの非アクティブなポアは、サンプルの準備が悪いせいだと思う。理由はわからないけど、ポアをブロックしたり詰まらせたりするのかも。数年前にオックスフォードのナノポアデータを分析したとき、サンプルの準備が上手くいっているかどうかにすごく敏感だと感じた。データの質がばらついていて、どの労働者(経験豊富な人か新しい人)がサンプルを準備したかをデータを分析することでわかるくらいだったから。だから、著者たちのガレージサンプル準備はあまり良くなかったんじゃないかな。偶然にも、車のバッテリーで動くポータブルシーケンシングラボを作っていた同僚がいたんだ。目的は、中央アフリカの田舎のバンからDNAでウイルスを特定することだった。最後に話したとき、技術的なボトルネックはサンプルの準備だった - バンラボの計算部分はそれほど難しくなかった。

電気ケトルを使ったサーマルサイクラーの代替は面白いね。サーマルサイクラーが発明される前は、こうやって古典的なDNA増幅が行われてたんだ。OP、血液を遠心分離して白血球を抽出して、それをシーケンスした方がいい結果が出るよ。全血よりもね。ただ、ランスと小さな装置を使うのはちょっと難しいけど…。

私たちは「ナノポアシーケンシングの時代」にいるわけじゃないよ。まだまだ合成によるシーケンシングの時代にしっかりといるからね。確かに、ゲノムを小さな部分に切り分けて、それを基にゲノムを再構築する必要がある(これには問題もあるけど)。でも、ナノポアシーケンシングはエラー率が高いから、まだまだ完璧とは言えない。臨床シーケンシングは今でも合成によるシーケンシングで行われてるし、Illuminaはこの10年でかなり上手くなったよ。ナノポアデバイスは本当にクールで、小さくて比較的安いけど、エラー率を補うためには、全てを何度もシーケンスすればいいんだ。ただ、このアプローチの経済性にはあまり詳しくないけど。SBS技術を使えば、信頼できる会社で1,000€/$未満で全ゲノムを30回(普通の「カバレッジ」)シーケンスできるかも。180$で見たことあるけど、それが信頼できるかは分からないな。

エラー率を補うためには、全てを何度もシーケンスすればいいんだ。普通はそうだけど、時々エラーが相関してることもあるよ。全体的には、ショートリードシーケンシングの方がコスト効率がいいと思う。俺のスタートアップで細胞株の品質管理のためにIlluminaの全ゲノムシーケンスをやると、合計260ドルかかるよ。

でもナノポアシーケンシングはエラー率が高いため、まだまだ完璧とは言えない。臨床シーケンシングは今でも合成によるシーケンシングで行われていて、Illuminaはこの10年でかなり上手くなった。ナノポアがショートリードのシーケンシングを置き換える理由はないよ。これはほぼ解決されていて、どんどん安くなってるからね。将来的な臨床利用は中規模や大規模な変異にあると思う。臨床の場では、SNPを理解するほどにはこれを理解していないから。だからナノポアは研究の場で使われていて、非常に稀な遺伝的疾患を持つ個人の診断にも使われてるんだ。(編集) > 私たちは「ナノポアシーケンシングの時代」にいるわけじゃない。まだまだ合成によるシーケンシングの時代にしっかりといるよ。俺も強く反対だね。SBSは非常に信頼性が高いけど、一般的だし(トヨタが最も人気のある車なら、それが内燃機関の時代ってことになるの?それともWaymoは小さな存在感でも重要なの?)。シーケンシングの新しさは、MLアプローチやRNA-DNA分析、長リードと短リード技術の組み合わせから来てるよ。

海外に自分の生物データを送る覚悟があれば、かなり安く手に入るよ。Nebulaゲノミクスや他の多くのバイオテックは、基本的に中国にアウトソーシングしてこれをやってる。特に技術的な秘密はなくて、ただ安い労働力と材料があるだけなんだ。

再構築がどう機能するのか、ずっと不思議に思ってた。控えめなプログラムを基本ブロックに分けて、それを再構築するのは難しいよね。本の段落も同じ。DNAではこれがどう機能するの?

ナノポアはハイブリッドシーケンシングに向いてるよ。高品質のイルミナリードを長い連続リードに合わせることができる。

それは間違いだよ。多くの診断ラボは、実際にはナノポアシーケンシングを選んでる。なぜなら、他の方法に比べて準備が全体的に安いから。関連する領域の感度も通常はqPCRと同じくらいだし、メチル化などの追加情報も得られる。最近のナノポアを使った急性白血病の分類に関する論文があるよ。https://www.nature.com/articles/s41588-025-02321-z/figures/8 タイムラインは誇張されてるけど、実際に機能するし、それが診断では重要なんだ。

現在もシーケンシング・バイ・シンセシスの時代にしっかりといますね。目標によって変わってくると思います。NAOでは、廃水のためにIlluminaの一番大きいフローセル(25B)を使ってます。探しているもの(例えば、呼吸器ウイルス)は全体の核酸の中ではほんの一部なので、ベースペアあたりのコストを最小限に抑える必要があります。でも、鼻のスワブをシーケンスする時は、これらのウイルスがもっと多く含まれているので、ナノポアの長いリードとランあたりの低コストがより適してますね。

Nebulaを使ったんだけど(今はリブランドされて高くなったみたい)、妻と自分、両親や兄弟の分もやったけど、結構簡単だったよ。『生涯プラン』にお金を払ったけど、他の人の分をやる前にそれがなくなっちゃって、まあ妥当な価格だったかな。FASTQファイルをダウンロードして、自分用にR2バケットに入れた。Nebulaの費用は約250ドルで、月額50ドルくらいのプランが必須だけど、すぐにキャンセルできるよ。もし私のゲノムに興味があったら、ここに私のVCFファイルがあるよ https://my.pgp-hms.org/profile/hu81A8CC もっと好奇心を満たしたいなら、$ rg "20189511" /Users/george/tmp/genome/nebula_roshan_NG1AW8W7PU.mm2.sortdup.bqsr.hc.vcf 3499829:chr13 20189511 rs104894396 C T 252.77 . AC=1;AF=0.500;AN=2;BaseQRankSum=1.54;ClippingRankSum=0.00;DB;DP=25;ExcessHet=3.0103;FS=4.008;MLEAC=1;MLEAF=0.500;MQ=60.00;MQRankSum=0.00;QD=10.11;ReadPosRankSum=0.666;SOR=0.160 GT:AD:DP:GQ:PL 0/1:15,10:25:99:281,0,436 これをLLMに入れるか、ここで調べてみて https://www.snpedia.com/index.php/Rs104894396 どの病原性変異にヘテロ接合体かがわかるよ。実際、妻と私がキャリアスクリーニングをしたときはNebulaを使わなかったけど、キャリアスクリーニングでもGJB2関連の聴覚障害遺伝子を共有していることが確認されたんだ。将来の子どもたちの胚も配列解析して、病気のない子を持てるようにしたよ。とにかく、遊び用の実際の人間のテストファイルが欲しいなら、私の(Nebulaからの)ファイルを見てみて。LLMを使えば、このデータを楽しむことができるよ(Y染色体のバリアントがあるから、男だってわかるよね)。Danteも使ったけど、彼らの配列解析とバリアントコールの結果を比較したかったんだ。残念ながら、ユーザーに戻す方法が違ってて(彼らはコードを持って安全に保管する必要があるけど、Nebulaはラベル付きの容器に入れるから、すでにマッピングされてる)、他のことに追われて急いでたからよくわからなかった。彼らはその件について全然返事をくれなかったし、コードをもらうリクエストを拒否することすらなかったから、どうなってるのか全然わからない。ナノポアの技術はすごく面白いけど、デバイスの品質管理に問題があるって聞いたことがある(Twitterで)。いつか試してみたいな、娘のゲノムと合わせてみたいし。

明らかな疑問:なんで自分のDNAを全世界にさらけ出すことにそんなにリラックスしてるの?

面白いことに、君はCYP11B1 rs4541 g;aを持ってるね。リコリスが嫌いでも驚かないよ。あまり見かけないCYP17A1 −34 T>C、rs743572(A;G)もあるね。もちろん、このエリアの全遺伝子の合計によるけど、この一つの変異がHPA軸に大きな影響を与える。もし体重が軽かったり、不安が強かったり、思春期にニキビがひどかったり、立ち上がったときにめまいがしたり、塩が欲しくなったり、睡眠に困ったりしてたら、これが主な要因かも。典型的な非古典的CAHだね。「ポツ症候群」かもって思ったことがあったら、もっと正確には低アルドステロン症かもしれない(でもレニン遺伝子による)。ここを探ってたら、いくつかのハイライトがあるよ。PCSK6 rs11855415 a;tも持ってるから、左利きか両利きの可能性があるね(塩の問題を助けることができるから)。ビタミンDのリスクもあるし、GG CYP2R1を持ってるから、医者はたぶん毎年それをチェックするだろうし、これが原因でマグネシウムが低くなるリスクもある( cramps や筋肉の痙攣?)。ビタミンに関しては、MTRR AA rs1802059(MTHFR 31 GT 76 CT、MET 30 CG、COMT 99 AG、BHMT rs3733890 G;Aと組み合わせて)でB9やB12が低めかもしれない。ほうれん草が好きかもね。TMJが定期的にあるなら、正しい食事やBコンプレックスを見つける必要があるよ。そうすれば、コラーゲン生成の問題からくる過剰な可動性も解決できる。近視の可能性が高いし、特にZ世代ならね。TPH2 rs4570625 g;tはセロトニン経路で目立つ。ビタミンDがここで助けになるかも。落ち込んでるときは5-HTPがいいって言う人もいるけど、まずはビタミンDを直そう。酸っぱいグミキャンディが好き?CYP1B1では3つの減少が見えるし、(上記と合わせて)家族に緑内障の歴史があるかどうか聞きたいな。もしそうなら、対策があるよ。CYP1A1 rs1048943 C;TとCYP1A2 rs762551 A;Aもあって、カフェインやメラトニンの問題が早い。もっと不眠症になるかも。CYP2E1では、他の人と同じことをするのにアセトアミノフェンが少なくて済む。理由は意図的に言わないけど、平均以上の知能があるよ。これらを組み合わせると、背が高く(6フィート1インチ?)、痩せて、寝つきにくく、寝るのが好きで、性欲が高く、左利きで、視覚能力が高い、オタクっぽい可能性があるね。おそらく、弱い形の共感覚もあるかも。トリビアルパースートより戦略ボードゲームが好きだろうね。早めの脱毛もあるかも。アルツハイマーの一種のリスクが高い(今日からできる対策があるよ)。喫煙はしないでね。ADHD遺伝子については詳しく見なかったけど、軽度の場合はビタミンDやB群の欠乏を解決することで影響が出るかも。これは10分ほど調べた結果で、包括的なものではないよ。主に、遺伝子の変異は大きなシステムの一部だということを一般の読者に伝えたかっただけ。もっと深く調べて、症状や検査結果と組み合わせて、変化の全体的な影響を把握することが重要だよ。たとえば、PCSK6の変異はCYP11B1の変異の影響を減少させる。さらに、HPA軸に別の要因があって、NCAHを完全に打ち消して塩の問題が全くないこともあるかもしれない。各遺伝子を調べる前に、まず「毎食に塩をかけるのが好き?」と聞いてみたいな。もう一つ、詳しく調べなかったけど、まず聞きたいのは甘いものが好きかどうか(NCAHに影響する低血糖)。気軽に連絡してくれれば、もっと詳しく説明できるよ。こういう話はいつも免責事項で終わる理由があるから、食事の変更については医者に相談してね。私は医者じゃなくて、趣味で生物学や遺伝学を学んだ人だから、特にそれがソフトウェアエンジニアリングやAI/AGIの仕事に役立つことがあるんだ。

最初のグラフは、時間とともにシーケンシングのコストがムーアの法則よりも早く下がっているのを示しているけど、2015年で止まってるね。それ以降の進展を見てみたいな。軽くググったけど、2021年までのプロットしか見つからなかった。私には、2015年以降は進展がムーアの法則より遅くなっているように見える。ナノポアがもっと信頼性を持つようになれば、状況が変わるかもね。

グラフは2001年から始まってるね。私は90年代半ばにEMBL(欧州分子生物学研究所)で学生として働いてたんだけど、バイオフィジックスの計測グループで薄膜電気泳動DNAシーケンサーのプロトタイプを開発してたんだ。ファルマシア・バイオテックがその技術を買って市場に出したんだ。確かその当時はかなり速いシーケンサーだったけど、1日に数百塩基対の話をしてる。

NHGRIは何年もこのプロットを更新してきたのに、2022年以降の更新がないのは悲しいね。資金不足が原因だと思う。$100未満のゲノムが今後5年以内に手に入るかもしれないと思ってる。

こいつらは宿題をちゃんとやってないね。商業ベンダーは置いといて、彼ら自身のガレージセットアップはカバー率(またはその欠如)から見ても失敗する運命だよ。ゴミはゴミを生む。

このスレッドのさまざまな会社に関する否定的なコメントが多い中で、手頃な価格で、そこそこ早くDNAをシーケンスして分析してくれる場所を誰か推薦してくれない?一般的な見解や具体的な変異についても興味があるんだけど。何かおすすめはある?

https://mynucleus.com をチェックしてみて!頬のスワブから全ゲノムDNAシーケンシングを約500ドルでやってるよ(コード savraj10 を使うと10%オフ!)。血液を取る必要もないし、2000以上の病気のリスクも教えてくれるし、パートナーがテストを受ければ未来の子どもたちの予測もしてくれるよ。アレクシスは私たちの投資家の一人で、来週大きな発表があるからお楽しみに!すべての生データのダウンロードもできて、SOC2とHIPAAにも準拠してるよ。

すごいね。こんなのが昔はすごく高額だったのに、一般人でも手が届くようになったんだ。今は約500ドル?すごい進歩だね。

モネロは受け付けてる?

私にとっての問題は、DNAをシーケンスすることじゃなくて、遺伝情報を第三者に信頼しなきゃいけないことなんだ。記事にも書いてあったけど、彼らはたったの13%のカバレッジしか達成してないし(すべてのベースコールが正しいとは限らないから、実際はもっと少ない)、遺伝分析には役立たないよね。だから、タイトルは本当に誤解を招くと思う。

もしあなたたちが破産した場合、23andMeの顧客が直面したような危機を防ぐためには何が必要なの?遺伝データと個人情報が最高入札者に売られることがあったから、当時の大問題だったし、差別化要因としても強力だったのに、ホームページにはそれについての記載が全然ないのは気になるね。Nucleusがデータを売らないと主張しているのはいいけど、23andMeも似たようなことを言ってたし、買収されたら遺伝データが移転されるのを防ぐには不十分だったよね。私はずっとこの分野に興味があったけど、今までのところ、プライバシーの懸念を満足のいく形で扱っている会社はないし、特に23andMe以降は不安が大きい。Nucleusがまた23andMeみたいなことをしないか賭けるのは、あなたが言ってる約3000ドルの節約に見合わない気がする。