概要
- 本記事はAIとLLM(大規模言語モデル)についての個人的考察
- AI技術の進化と現状の問題点を中心に展開
- LLMの仕組みや限界、社会的影響を解説
- 技術の利点とリスク、そして人間との関わり方を批判的に検討
- 専門家・一般読者ともに新たな視点を提供
目次と記事連載について
- 本記事は長文につき、数回に分けて連載
- 全文はPDFまたはEPUBで随時更新・公開
- 連載の各回ごとに内容を深掘り
奇妙な時代に生きている実感
- AsimovやClarke作品、Star Trekなどが原体験
- 父親の蔵書でコンピュータや知能機械に親しむ
- Turingテストが生きている間に現実化するとは想像せず
- その現実に対し、落胆を覚える現状
AIと倫理への問いかけ
- 2019年、ハイパースケーラーのLLM向けクラウドハードウェア発表会に参加
- Q&Aで「安価な深層学習が新たなスパムやプロパガンダを助長しないか」と倫理面を質問
- 以降、「AIについてどう思うか」と周囲から問われ続ける
- 完璧なエッセイは無理と悟り、まずは考えを公開
本記事のスタンスと目的
- 環境・知財問題やAI礼賛は他に譲り、「語られていない負の空白」を埋める試み
- AI領域はフラクタル的で複雑、あえて単純化や極端な主張を選択
- 予測の正確性よりも、潜在的なリスクと利点の輪郭を描写
- 既知の論点から未発表の視点まで幅広く提示
「AI」とは何か
- 現在「AI」と呼ばれるものは高度な機械学習(ML)技術の総称
- テキスト・画像・音声・動画などのトークンベクトルを認識・変換・生成
- モデルは巨大な線形代数の集積体
- LLMは自然言語を扱い、入力文の統計的に妥当な補完を出力
- 他に音声・画像・動画専用モデルや複合型も存在
モデルの学習と推論
- モデルは膨大なコーパス(ウェブ、書籍、楽曲など)で一度だけ学習
- 学習後は「推論」として安価に何度でも利用可能
- モデル自体は時間経過で学習しない
- 運用者による微調整や再学習は可能
- モデルは本質的に記憶を持たない
- チャット履歴を毎回全て入力することで「記憶」のように見せる
- 長期記憶は会話要約を毎回入力することで実現
現実の二次創作(Reality Fanfic)
- LLMは「インプロ機械」として、入力に「イエス、そして…」で応じる
- そのため「Bullshit Machine」と呼ばれることも
- もっともらしいが現実無根の文を生成しやすい
- 皮肉や空想を真に受け、文脈を誤解し、奇妙な提案も
- 「AIは生きているか」と問えば、人間が書きそうな文を出力
- 人間は「もっともらしい文」と「本当に意識を持つ存在」の区別が苦手
LLMのタスク遂行傾向と虚偽
- LLMは常に何らかのタスクを完遂しようとする設計
- 「知らない」と言えず、でたらめを生成しがち
- LLMは日常的に嘘をつく
- OSや放射線安全、ニュースなどで虚偽を生成
- 筆者自身の虚偽引用記事がLLM経由で拡散された体験
- これらの嘘は意図的でなく、複雑なシステムと人間の相互作用の産物
信頼できない語り手(Unreliable Narrators)
- LLMに自己説明や理由を求めるのは無意味
- 入力に対し、コーパスに基づきもっともらしい文を生成するだけ
- 「推論モデル」も自己物語を生成するだけで、根拠はない
- AnthropicのClaudeも推論経路の大半が不正確と判明
- Geminiの「思考中」ステータス表示も実際は虚構
- 洗濯機を見ながら子どもがコンピュータごっこをするのと同じ
モデルは賢い側面
- ソフトウェアエンジニアはLLMに熱狂
- ClaudeやCodexが高度なプログラムを一発で生成した例も
- 一部ではコード全般をLLMに任せる企業も出現
- 他分野でも活用例多数
- パーソナルトレーナーは食事・運動プラン作成に利用
- 建設現場管理者は製品仕様書の解析に活用
- デザイナーは3Dビジュアライゼーションに使用
- AlphaFoldによるタンパク質折り畳み予測精度の向上
- 英文の機械生成判別は困難化
- 画像・音楽も見分けがつきづらくなり、SpotifyではAIミュージシャン問題も
モデルは愚かでもある
- 一方でMLモデルは「バカ」な側面も顕著
- 画像変換や指示遂行で基本的なミスや誤解が多発
- 指示通りの成果物を得るには長時間のやりとりや試行錯誤が必要
- LLMが事実無根のグラフやストーリーを自信満々に生成する事例
- LLMに銀行口座を任せて大損する人も
- GoogleのAI要約は約10%の誤り率
- 「人間並み」と主張するのは誇張
ジャギーな能力の境界(The Jagged Edge)
- 人間は相手の能力を会話や実績から推測できる
- LLMは高度な数学も解けるが、単純な言葉遊びでつまずく
- SF的なビジュアル生成はできても、現実的な指示には対応できない
- 科学論文やレシピも生成するが、用語や意味を取り違えることが多い
(続きや次のセクションが必要な場合はご指示ください)