世界を動かす技術を、日本語で。

MRIのセカンドオピニオンを得るためにClaude Codeを利用しました

2026年6月29日原文(antoine.fi)

概要

  • Opus 4.8 を使い、MRI診断結果のAIによるセカンドオピニオン体験を共有
  • 医療AIの現状と課題、そして人間医師との判断の違いを検証
  • 治療内容や診断の疑問点をAIと比較検討
  • AI診断と医師診断の食い違いによる葛藤
  • AI活用の可能性と今後への期待

Opus 4.8でMRI診断結果をAIレビューしてみた体験記

  • 右肩の痛み を数週間感じ、整形外科を受診

  • クリニックで MRI検査 を受け、「 腱板部分断裂(Grade III)」と診断

  • 治療提案が即時かつ積極的で、やや拙速な印象

  • MRI画像データ (DICOM形式、約266MB)を入手し、AIによる再分析を決意

  • Opus 4.8(Claude Code環境)にて、必要なパッケージを自動インストール

  • 入力情報:「右肩の痛み 2~3週間」程度のみ

  • 約1時間後、AIによる 詳細レポート を取得(PDF 7.72MB)

    • 医師診断 :50%以上の部分断裂
    • Opus 4.8診断 :腱は損傷なし(intact tendon)
  • AIと医師の診断結果が大きく食い違う事態に困惑

治療内容とAIによる指摘

  • ショックウェーブ治療 :ガイドラインでは「石灰化なき腱板障害には非推奨」とAIが指摘
    • エコーで石灰化なしと診断されていた
  • Traumeel注射 :ドイツでは「治療効果が認められていないホメオパシー薬」とAIが指摘
  • これらの治療法にAIが疑問を呈し、信頼感が低下

AI診断と人間医師診断の比較・仲裁

  • Opus 4.8に 人間医師の診断レポートChatGPT 5.5 Proとの対話記録 も追加提供

  • 複数エージェントによる バイアス排除型の分析手法 を採用

  • 約1時間後、 仲裁レポート (PDF 4.52MB)を取得

    • AI仲裁の結論:「Reader A(AI側)の診断を中~高信頼度で支持」
    • 「明確な部分断裂は認められず、軽度の腱炎所見のみ」
  • AIは、意見が分かれる部分については「判定不能」と明記しつつも、本件では明確に判断

AI診断を受けた後の心境

  • 信頼できる専門家の存在 は安心感をもたらす
  • AIによるセカンドオピニオンは、その安心感を 逆に揺るがす体験
  • AI診断で「治療や診断が早計だったのでは」との疑念が生じるも、AIを完全に信頼できる段階には至らず
  • 「別の医師に再度相談するか、リハビリ経過観察か」で迷う状態
  • 将来的に、AIがMRI診断もメールの校正のように 信頼される存在 になることを期待

本記事の趣旨と注意事項

  • クリニックや医師名は非公開、目的はAI活用の技術的好奇心の共有
  • 自分やAIの誤解の可能性 も十分に認識
  • 本記事は医療アドバイスではない 旨を強調

Hackerたちの意見

私は放射線科医だけど、フルの3D MRIデータセットを見ないと意見を言えないな。この点については、

「最近の臨床ガイドラインでは、石灰化がない回旋腱板腱症に対して、ショックウェーブ療法を使用したり推奨したりすべきではないと言っているのに、肩にショックウェーブ療法を受けた。超音波検査では石灰化はないと言われた。」 超音波検査は石灰化を評価するにはあまり良くない方法なんだ。大きな石灰化は見つけられるけど、小さいのは見逃しやすい。普通のレントゲンの方が役立つかもしれないけど、MRIでも分かることがあるかもね。どちらにしても、石灰化がない場合、ショックウェーブ療法は害はないけど、役に立たないだけ。追記:放射線レポートで何かが存在しないと言われるとき、常にその発見が得られたモダリティや画像の文脈内で存在しないという暗黙の注意があるんだ。だから、超音波レポートでは石灰化がないと言っても、普通のレントゲンでは石灰化があると報告できることが矛盾しないんだよね。患者や医療用語に不慣れな人には当然混乱を招くけど、レポートでこれを明確にすると、さらに専門的で、ちょっと面倒くさくなるかも。

なんか頭がおかしくなりそう。ほかのコメントでも、これは他の怪我に対しても良い治療法だって言ってる人がいる。あなたは実際の放射線科医で、そのアドバイスの問題点をすぐに指摘してる。こういうパターンを何度も見てきた。誰かが本物の専門家だと、AIの出力が不十分だったり、不完全だったり、誤解を招くことが多い。AIが何をするように求められているか分からないときだけ、出力が役に立つことがある。これ自体が私には驚きだけど、他の人はこのことがAIサービスにとってかなり致命的だとは思っていないみたいで、便利さやスピードに感心している。

なんで整形外科で診断用超音波が使われないんだろう?毎日胎児の心臓や他の臓器を検査してるのに、肩はどうして?もっと安くて早いと思うんだけど。

え、みんなが言ってる言葉を読んで調べてたら、自分の右肩に出てる症状とまったく同じに見えてきた!デスクの横に巨大な穴が開いた気分。

私は放射線科医です。この資格がないコメントは、あまり真剣に受け取らない方がいいよ(はい、これも含めてね)。医療画像って、みんなが簡単だと思ってるけど、実際には知らないことが多いんだよね。私は心臓超音波技師だけど、放射線科医もAIが仕事を奪うっていう意見を聞くことが多いと思う。

超音波のレポートでは石灰化がないって言われるのに、普通のレントゲンでは石灰化があるって報告されることもあるから、患者や医療用語に詳しくない人にはすごく混乱するよね。これを言うのは優しすぎると思うけど、これが理解できない人はちょっとアホだと思う。こんなことで混乱するには、すべての診断機器が無限の明瞭さを持っていて、常に正しいって思わなきゃいけないからね。バベッジの名言を思い出すよ。誰かが「このコンピュータに間違った質問をしたら、正しい答えは返ってくるの?」って聞いたら、彼は「そんな質問をする心の論理が理解できない」と答えたんだ。

同意。私は放射線科医じゃないけど、MRIの研究を結構やってる。専門家と素人では、最先端のモデルから正しい診断を得る成功率が違うかも。ちょっとしたプロンプトの違いで、診断が変わることもあるよね。

じゃあ、オーパスが正しいかも?

放射線科医って本当に年収70万ドル以上もあるの? Redditで放射線科医を名乗る人がそう言ってたけど、その仕事がなくなったら貯金はどこに行くんだろう。

個人的に新しいAIの世界で一番好きな機能は、自分が直接使うときじゃなくて、マネージャーが問題を解決しようとして使うときだね。その結果を私に伝えてきて、私のプロセスを理解していない人に説明しなきゃいけないのが面倒くさい。

確かに、でもこれはAIが登場するずっと前からの問題だよね(この記事を読んだり、会議でこの人に会ってxを聞いたり、上司がblahと言ったり)。AIがそれを悪化させているかもしれないけど、クソみたいなマネージャーはどこにでもいる。

彼らがあなたの解決策に挑戦して、LLMにフィードバックしてその返答を送ってくると、さらに悪化するよ。LLMと議論するのは疲れるし、その返答を繰り返す人と代理で議論するのは本当に苦痛。良い点は、こういうことをすると、最初の1分を超えてその問題について会話ができないから、「クイックチャット」ミーティングでカレンダーを埋められないことだね。

Hacker Newsで議論の続きを見る