世界を動かす技術を、日本語で。

クロードのメモリアーキテクチャはチャットGPTの逆である

概要

  • ChatGPTとClaudeのメモリシステムは 正反対の設計 を採用
  • Claudeは ユーザーが明示的に操作する メモリ方式
  • ChatGPTは 自動的・継続的にユーザープロファイルを構築
  • それぞれの設計は ターゲットユーザー層や哲学 の違いを反映
  • AIメモリ設計は 広大な未開の領域 であり、今後も進化が続く見込み

Claudeのメモリシステムの仕組み

  • Claudeは 会話ごとに完全な白紙状態 からスタート
  • ユーザーが明示的にメモリを呼び出す まで、過去の履歴やプロファイルは利用しない設計
  • メモリ呼び出しは、「 what did we discuss about」や「 remember when we talked about」といったフレーズで認識
  • メモリ呼び出し時、 conversation_searchrecent_chats の2つのツールがリアルタイムで起動
  • 過去の会話履歴のみを 直接検索・参照 し、AIによる要約やプロファイル圧縮は行わない

Conversation Search

  • conversation_search はキーワードやトピックごとに会話履歴全体を横断検索
    • 例:「 Chandni Chowk についての会話を検索」→関連する9件の会話を抽出し要約
    • 複数トピック指定時は 個別に検索を実行し統合 した結果を返却
      • 例:「 MichelangeloChainflipSolana に関する会話」→それぞれ22件の会話を抽出・リンク付きで提示

Temporal Chat Retrieval

  • recent_chats は時系列で会話履歴を検索・取得
    • 例:「 直近10件の会話 を要約」や「 2024年11月最終週の会話 を抽出」など、指定期間での履歴取得が可能

ChatGPTとClaudeの比較

  • 1年前は両者とも 同等の機能 (複数モデル、ファイル添付、プロジェクト管理)を提供
  • 現在は 進化の方向性が大きく分岐
    • ChatGPT :大衆向けの消費者製品へ進化
      • 自動でユーザープロファイルや履歴を常時ロード
      • 即時パーソナライズ利便性重視
      • 広範なユーザー層 (学生、家庭、趣味層など)をターゲット
      • 詳細なプロファイリングや将来的なマネタイズ を視野
    • Claude :技術者・プロフェッショナル向けツールを志向
      • 明示的な操作やコントロール を好むユーザー層
      • メモリ呼び出しの遅延や手間を許容 し、必要な時だけ利用
      • プライバシー志向 が強く、過度なプロファイリングを避ける
      • 開発者・専門職のワークフロー最適化 に重点

AIメモリ設計の多様性と今後

  • ChatGPTとClaudeの事例は AIメモリ設計の幅広さ を象徴
  • ユーザー像や用途から逆算した設計 が不可欠
  • AIアシスタントの利用が10年以上に及ぶ場合の 長期的な記憶管理の課題 は未解決
  • AIアプリの急増 により、各社が独自のメモリアプローチを試行錯誤中
  • ベストプラクティスは未確立、今後も多様な実験と進化が続く見通し

今後の展望

  • 今後も 様々なAIメモリアーキテクチャの分析最新研究の解説 を予定
  • 進化し続けるAIメモリ領域 の最新動向を随時発信

Hackerたちの意見

この投稿は素晴らしかった!とても分かりやすく、例もよくillustratedされてたね。

サイモン、ありがとう!あなたの文章の大ファンだよ。

Claudeのメモリ実装が大好きなんだけど、ChatGPTではメモリをオフにしたんだ。いろんなことに使いすぎてて、実際には関係ないこと同士で関連付けをされるのがちょっと変だったから。

その通りだね。過去のチャットをいつ取り出すかのコントロールが本当に価値がある。ChatGPTだと、もう二度と参照したくない会話からの余計な情報が混ざっちゃうことがあるから。

面白いことに、ChatGPTが基本的なことを全然覚えられないんだよね。今、言語を学ぶために使ってるんだけど(いろんなAIチューターを試したけど、ChatGPTが圧倒的に良かった)、いつも「もっとゆっくり話して」って言わなきゃいけない。これをルールとして覚えてもらうように言っても、全然覚えられないんだよね。変な感じ。ほかにもいろいろあるし。

私は逆だな。ChatGPTが自動的にメモリから引き出す能力は、聞くことを覚えるよりずっと良いと思う。

前回の幻覚を覚えているだけで、それをまた持ち出してくるからオフにしたよ。

ChatGPTのメモリ実装の詳細へのリンクが壊れてるよ。正しいリンクはこれだよ: https://www.shloked.com/writing/chatgpt-memory-bitter-lesson これめっちゃ面白い!ChatGPTでメモリがどう実装されてるのか気になってたんだ。全然違うアプローチを見るのは興味深いね。Claudeのは技術的なタスクを解決するのに向いてる気がするけど、ChatGPTのはカジュアルな会話を改善するのに向いてるみたい(そして、指摘されてるように、将来的な広告統合にも)。こういう言語ベースのメモリは、もうすぐ古臭くなるんじゃないかな。誰かが、言語表現を飛ばしてエンコードされた形でメモリを保存・取得する方法を見つけると思う。それがAGIに必要な最終的なブレークスルーになるかもしれないね。

それがAGIに必要な最終的なブレークスルーになるかもしれないね。 それには同意できないな。私の理解では、今のLLMは概念を理解していない。実際、理解していないんだ。基本的には強化されたマルコフ連鎖みたいなもので、知性はないと思う。私の意見では、実際の知性がAGIの前提条件だよ。

AGIは欲しくないよ。それをどうやって従わせるの?

メモリの仕組みもすぐに変わるみたいだよ: https://x.com/btibor91/status/1965906564692541621 編集: どうやらこれも発表されたみたい: https://www.anthropic.com/news/memory

これのために現在のメモリシステムがなくなるのはすごく悲しい。

実装の違いは、ビジネスの目標に基づいていることが多いね。ChatGPTには明確な方向性がある。いつか広告やアフィリエイトリンクでマネタイズするつもりだと思う。彼らのメモリ実装はユーザープロファイルを作ることを目指している感じ。Claudeのメモリ実装は、過去のやり取りや抽象的な情報にアクセスする長期的な目標に向いている気がする。人間が記憶にアクセスする方法にかなり近いけど、検索機能があるって感じ。(まだ実装されてないと思うけど)彼らは現在の実装を活用して、Claudeが前回指摘したミスを「覚えている」ようにする明確な道筋がある。将来的には、特定の会話から抽象的な情報を引き出せるようになるかも(例えば、「ユーザーが前回このタスクでxyzの変更を頼んだから、エージェントがそれを先にやるか、前回エージェントがやったプロセスはこれだった」みたいに)。基本的には、ChatGPTはあなたを一人の人間として覚えたいけど、Claudeはあなたの過去のやり取りを気にしているって感じかな。

Anthropicがパーソナライズされた広告を出さないなんて思わない方がいいよ。

なんで「明確な方向性」が広告につながると思うの?私には明らかじゃないな。ChatGPTはソーシャルメディアじゃないし、サブスクリプションから十分にお金を稼いでるから、同じ方法でマネタイズする必要はないと思うよ。企業やビジネス、APIもあるし。

外部メモリストア(同じような実装を前提として)をツールコールやMCPを通じて使う場合、どんな障壁があるの?プロバイダーは、ツールコールに関して行われていることと同じように、メモリ実装を良くするために強化学習を使っているのかな?(特定のツール実装を「トレーニング」する感じ)データプライバシーの観点から来てるんだけど、LLMはどうせ取得しているのは分かっているけど、推論中にそれをはっきり言いたくないんだ。「興味:MacOS、ボンデージ、ディシプリン、野球」

ちょっと前にChatGPTのメモリとチャット履歴について書いたんだ。自分で情報をダンプする方法も含まれてるからシェアしておくね。https://embracethered.com/blog/posts/2025/chatgpt-how-does-c...

「Claudeは、あなたの生の会話履歴だけを参照して思い出すんだ。AIが生成した要約や圧縮されたプロフィールは一切なし。実際の過去のチャットをリアルタイムで検索するだけ。」つまり、Claudeはベクトル検索をしてるってこと。例えば「Chandni Chowk」について聞くんじゃなくて、「問題を抱えてた同僚」について聞くと、全然ダメ。要約もプロフィールもないし、ナレッジグラフもなし。これは専門的な機能じゃなくて、単にあまりうまく機能しないってことだね。

https://www.shloked.com/writing/chatgpt-memory-bitter-lesson について、著者がChatGPTがメモリが無効のときにそのプロンプトを注入していると思っているのか、すごく混乱してる。メモリが無効のときは、少なくとも私の経験では、最近の会話や個人的な好みのメタデータは注入されてないのは明らかだよ。その会話はその会話だけの独立したものになる。もし彼が実験のためにメモリをオンオフしてたなら、何か混乱したのか、もしくは私が記事をちゃんと読んでなかったのかも?

「これらのほとんどは、単にChatGPTに直接聞くだけで明らかになった。結果は信頼できるのか、それともただの幻覚なのか?ChatGPTが自分の動作を知っている理由は何だろう、そしてなぜこの種の学習素材が与えられているのか?」

そうだね、LLMにどうやって動くのかを聞くのはあんまり役に立たないけど、彼らが使える機能のシグネチャー(呼び出せるツール)について聞くのは結構うまくいくよ。だって、そのツールはシステムプロンプトにすごく詳細に説明されてるから。