概要
- OpenAI はAIの 幻覚(hallucination) 問題に取り組み中
- 幻覚とは、 言語モデル が自信満々に誤った情報を出す現象
- 現在の 評価方法 が「推測」を促し、謙虚さを評価しない点が原因
- 解決策は「 自信過剰な誤答」を厳しく評価し、「不確実性表現」を部分的に評価すること
- 最新モデルでは幻覚率が下がっているが、完全解決には至っていない
OpenAIにおける幻覚(hallucination)問題
- OpenAI はAIシステムの 有用性と信頼性 向上を目指す
- 言語モデルが進化しても、 幻覚 問題は依然として解決困難
- 幻覚とは、 モデルが本当でない答えを自信満々に生成 する現象
- ChatGPTやGPT-5 でも幻覚は減少傾向だが、完全には消えていない
- 全ての大規模言語モデルに共通する 根本的課題
幻覚とは何か
- 幻覚: もっともらしいが誤った内容 を生成する現象
- シンプルな質問でも 予想外の誤答 が現れる
- 例:著者のPhD論文タイトルや誕生日を複数回誤答
- 正答・誤答・無答(abstention) の3分類で評価可能
現在の評価方法の問題点
- 現行の評価法は「 推測」を促進し、「 不確実性の表明」を評価しない
- 正答率のみを重視することで、 誤答(幻覚) の発生率が上昇
- 例:分からない場合でも「I don't know」より ランダム推測 が高得点
- 正答率重視のスコアボード がモデルの推測傾向を助長
- OpenAIの価値観 では、誤った自信よりも「謙虚な無答」を重視
モデル別評価例
- o4-mini :正答率24%、誤答率75%、無答率1%
- gpt-5-thinking-mini :正答率22%、誤答率26%、無答率52%
- o4-mini は正答率が僅かに高いが、 誤答率が圧倒的に高い
- gpt-5-thinking-mini は「無答」を多用し、誤答率を大幅低減
幻覚発生の根本原因
- 言語モデルの 事前学習 は「次の単語予測」が中心
- 「真偽ラベル」なしで、 自然な言語パターン のみ学習
- 低頻度事実 (例:誕生日)はパターンから予測不可能
- スケール拡大で「スペルミス」等は減るが、「事実誤認」は残存
幻覚対策と今後の課題
- 自信過剰な誤答にペナルティ、 不確実性表現に部分点 が有効
- この考えは新しくなく、 一部試験では既に導入
- 主要な評価指標自体を 「謙虚さ」も評価する形へ見直し が必要
- 評価法の抜本的改革が、 幻覚低減技術の普及 を後押し
幻覚に関する誤解と事実
- 「 正答率100%なら幻覚ゼロ」→現実は不可能、答えられない質問も存在
- 「 幻覚は避けられない」→無答を選択すれば回避可能
- 「 大規模モデルのみ幻覚回避可能」→小規模モデルでも限界認識は容易
- 「 幻覚は不可解なバグ」→統計的な仕組みで発生・評価で強化される現象
- 「 良い幻覚評価指標だけで十分」→全体の評価指標見直しが不可欠
今後の展望
- 最新モデル は幻覚率が低下傾向
- 自信過剰な誤答の更なる削減 に向けて継続的に研究開発
- 評価方法の刷新 が、より信頼性の高いAI実現の鍵