概要
- 長期的なアシスタントやエージェントシステムにおける履歴情報の蓄積と再利用の重要性
- 単純なコンテキストウィンドウ拡張の限界
- $\delta$-mem による軽量なメモリ機構の提案
- 固定サイズの状態行列による効率的な情報圧縮と更新
- メモリ負荷の高いベンチマーク での顕著な性能向上
長期記憶のための軽量メモリ機構「$\delta$-mem」
- 大規模言語モデル (LLM)における長期的な履歴情報の蓄積・再利用の必要性
- コンテキストウィンドウの単純な拡張は
- 計算コスト増大
- 効果的な文脈利用の保証困難
- $\delta$-mem の提案
- フルアテンションのバックボーンを 凍結
- 小規模なオンライン状態の 連想メモリ を追加
- 過去情報を 固定サイズ状態行列 へ圧縮
- デルタルール学習 で逐次更新
- 読み出し結果をアテンション計算へ 低ランク補正 として活用
- 8×8 の小型オンラインメモリ状態のみで動作
- 平均スコア
- バックボーン単体比1.10倍
- 最強非$\delta$-memメモリベースライン比 1.15倍
- メモリ依存度の高いベンチマーク
- MemoryAgentBench:1.31倍
- LoCoMo:1.20倍
- 一般能力の大部分を維持しつつ 大幅な性能向上 を実現
$\delta$-memの技術的特徴
- フルファインチューニング不要
- バックボーンの 置換や再学習不要
- 明示的なコンテキスト拡張なし でメモリ強化
- アテンション計算と 直接連携 する コンパクトなオンライン状態 による効果的な記憶実現
- 計算効率 と メモリ効率 の両立
今後の展望と意義
- 長期対話エージェント や 履歴依存タスク での応用拡大
- 低リソース環境 や オンデバイス実行 での有用性
- メモリ機構の設計指針 として新たなアプローチの可能性