世界を動かす技術を、日本語で。

クロード・コードの「エクステンデッド・シンキング」出力のテキスト

概要

  • Claude Codeのセッションログには 暗号化された推論記録 が含まれる
  • ユーザーは 推論内容のサマリー しか受け取れない仕様
  • 完全な推論内容の取得にはエンタープライズ契約 が必要
  • ローカルファイルから 監査証跡を得ることは不可能
  • ドキュメント表現が 分かりにくい 点に注意

Claude Codeの推論ログ仕様と注意点

  • Claude Codeは各セッションのログを ディスクに保存
  • ログ内の“thinking blocks”は モデルの推論プロセス を示す部分
  • 実際には600文字程度の 署名(signature) のみ記録
  • 推論内容は Anthropicによって暗号化 されている
  • 復号鍵はAnthropicが保持 しており、ユーザーの端末には渡されない
  • API経由で返されるのは 推論のサマリー のみ
  • 完全な思考出力の取得にはエンタープライズ契約 が必須
  • Matt Greenによる 署名ブロックの追加調査 も存在
  • 監査証跡や詳細な検証 を約束する前に仕様を要確認

“extended-thinking”出力の実態

  • ctrl+oなどで得られる“extended-thinking”は Fable/Opusの推論サマリー
  • 実際にモデルが行った推論そのもの ではなく、 論理の要約 に過ぎない
  • 例えるなら「 jpegをbmpに変換し、再度jpegとして扱う」ような データ損失 が発生
  • サマリーは 本来の推論内容を完全には再現できない

ローカルファイルと監査証跡の限界

  • ローカルファイルからは推論内容を取得できない 仕様
  • 取得可能なのは 入力・出力・実行アクションのログ のみ
  • スクレイピングなどで行動記録は残せるが、 推論の根拠自体は不可視
  • 推論内容の完全な監査証跡は不可能 である点に注意

ドキュメント表現とユーザーへの影響

  • ドキュメントの 表現が間接的かつ分かりにくい 傾向
  • “extended thinking returns a summary of Claude’s full thinking process”という表現が 誤解を招きやすい
  • 実際の推論内容が得られると誤認しないよう要注意

オープンソースモデルへの要望

  • オープンソースAIモデルの性能向上 が急務
  • 透明性や検証性の向上 が今後の課題

Hackerたちの意見

実際の思考がモデルの行動を促しているわけじゃなくて、思考のロジックの要約なんだよね。これは、jpegを.bmpとして保存してから.bmpを編集して、それを.jpegとして提示するようなもの。変換するとデータが失われるんだ。逆だよ、.bmpはロスレスフォーマットで、.jpegはロスのあるやつだから。

ごめん!ハウス・スリザリンに10ポイント!

これはアンソロピックだけの話じゃないよ。OpenAIやGoogleを含むほとんどの大手AI企業は、自社のモデルの実際の推論を隠してるんだ。生の推論を明らかにすると、AIが情報をどう処理しているかが丸わかりになっちゃうからね。これらの企業は、競合よりも優れた思考プロセスを開発するために、膨大な研究開発費を使ってるんだ。その思考メカニズムを競合にさらすことは、彼らの投資の目的を完全に無にすることになるから、絶対にやらないよ。まるで、自分を追い詰めている相手に正確な位置を教えるようなものだね。

もっと言うと、もし彼らがモデルの「思考」推論を公開したら、競合はそれを使って結果を再現できちゃうんだ。もしその内容を後処理して、例えば要約したりしたら、競合にとってはあまり役に立たなくなるんだよね。

それか、AI企業が権利者の許可を得ずにモデルの重みを変換できるような機械可読形式で世界の情報を提供することだね。

シニカルな私としては、ソーセージの作り方を明らかにすることで悪い評判が立つかもしれないって思ってるんだ。

そうだね。裏で何が起こってるのか理解するのが難しくなるよね。

これは、生の推論を明らかにすることで、AIが情報を処理する方法が正確にわかるからです。これらの企業は、競合他社よりも優れた思考プロセスを開発するために、巨額のR&D費用を投じています。その思考メカニズムを競合にさらすことは、彼らの投資の目的を完全に無にすることになります。彼らは絶対にそれをしないでしょう。まるで、あなたが自分の正確な位置を追いかけている人に教えるようなものです。私は、推論が「整合性のある」モデル出力とあまりうまく機能しないから、その整合性を推論中に取り除いて、それを隠す必要があるのだと思っていました。

Mistralは思考モードで「考えている」テキストを表示するけど、それが本物のトークンかどうかわかる?読むのが結構面白いよね。中を覗いて、詰まっているかどうかを見る能力がなければ、こんなモデルを使うのは想像できないな。

自分の個人データをエクスポートすると、Googleはすべてのモデルの応答を隠して、ユーザーのメッセージだけを残すんだ。だから、さらに悪化してるよ。

実際、opusの「思考」トークンのqwenの微調整があって、opusのように考えるように教えてるんだ。 https://huggingface.co/Jackrong/Qwen3.5-27B-Claude-4.6-Opus-...

競合にその思考メカニズムをさらけ出すのは、彼らの支出の目的を完全に無にすることになると思う。理由の一つは、責任を制限するためかもしれないね。もし推論が疑わしいソースの出所を確立するのに役立つとしたら?もし推論やモデルの「思考」が、モデルが特定の問題のある応答を生成するように訓練された方法の根本的な問題を指摘することになったら?

Hacker Newsで議論の続きを見る