概要
- 現代のLLMベースAIは、インターネットの混沌から答えを導き出す能力
- 構造化された情報管理の失敗がAIの台頭を後押し
- 検索頼みの情報整理手法が主流化
- セマンティックウェブや個人知識ベースの未実現
- AIは優雅な設計ではなく、力技による回避策
LLMがもたらす「検索」時代の知識体系
- ChatGPT のような最新のLLMは、従来の 全文検索エンジン では対応できない複雑な質問にも瞬時に回答
- 例:「1805年にイギリスが初めて小さな植民地を設立し、同年にスウェーデン王Gustav IV Adolfがフランスに宣戦布告した国の国旗に描かれている動物は?」→ Dominica の国旗に描かれた Sisserou parrot
- GoogleのAIウィジェット はこの問いに失敗、LLMの圧倒的な強みが浮き彫り
- LLMは大量の未整理情報から意味的関連を推定し、 混沌から構造を抽出 する能力
- これは、人類が情報をうまく構造化できなかったことの「副産物」
構造化の放棄と「検索」依存の時代
- 多くの現代サービスは、情報の 構造化を諦め、検索に依存 する設計パターン
- 例:Google Driveはクラウド上の「ファイルシステム」だが、整理が難しく デスクトップのファイル管理以下の体験
- 解決策は「 全文検索」の導入:「全部放り込んで、あとで検索して探す」スタイルへ
- この「構造を諦めて検索に頼る」パターンが静かに 主流 となった
- 「検索」は単なるテキストマッチングから、 多次元トークンマッチング まで多様化
セマンティックウェブと個人知識ベースの未達
- Semantic Web 構想では、ウェブ全体を 構造化された意味的リンク で繋ぐ理想追求
- 現実は未構造化・メタデータ不足、さらに JS駆動の動的HTML で機械可読性も悪化
- 本来、PCは 個人の知識ベース として、HyperCardのような 意味的接続 を活用する可能性
- しかし、その実現は未だ遠く、 オープンスタンダード やセマンティックリンクも普及せず
LLMの本質:力技による知識抽出
- もし全知識が リッチなセマンティックリンク で構造化されていれば、 単純な自然言語処理 でも複雑な質問に対応可能
- その場合、 圧倒的に少ない計算資源 で答えを導出できる
- 何より、知識とその接続性が AIモデル内部に隠蔽されず、人間にも理解可能
- 現状のAIは「 優雅な設計」ではなく、 力技によるワークアラウンド
- LLMは未整理情報から 仮想的な意味マップ を生成し、一時的な「知識体系」を構築
- これは「古典的な知識」とは異なるが、 もしかすると本質的には「知識」そのものかもしれない