LLMは例外に対して致命的な恐怖を抱いている

2025年10月10日原文(twitter.com)

概要

Andrej Karpathyによる AIエージェント の未来に関するXポスト要約
AIエージェント が今後のインターフェースとなる可能性
人間の役割 とAIの協調について言及
AIの進化 による社会的インパクト
今後の 技術的課題 と展望

KarpathyによるAIエージェントの未来展望

AIエージェント が将来的に 主要なインターフェース となる可能性
現在のアプリやウェブサイトに代わる 新たなユーザー体験 の創出
人間の要求 や問いかけに対し、 AIが自動的にタスクを遂行 する仕組み
AIエージェント が人間の アシスタント や 代理人 として機能
個人ごとにカスタマイズ されたAIによるサービス提供
- ユーザーの 好みや履歴 を学習
- 最適な提案 やサポートの実現
AIの進化 により、より高度な 意思決定 や 問題解決 が可能
社会や産業 への大きなインパクト
- 生産性向上 や 新しい職業 の創出
- 一部作業の 自動化による再構成
人間の役割 は、AIと 協調する方向 へシフト
- 創造性 や 倫理的判断 など、人間特有の価値
- AIとの パートナーシップ 強化
今後の 技術的課題
- セキュリティ や プライバシー の確保
- 説明可能性 や 信頼性 の向上
- 倫理的側面 への対応
AIエージェント が普及することで、 人間中心の社会 実現への期待

Hackerたちの意見

出力が「何が起こるかわからないから、非常に慎重に行う」と説明していることを考えると、公開されていないプロンプトは「すべてのエッジケースを処理するPythonの割り算関数を生成せよ。非常に注意深く」といった内容だったんじゃないかな。これは、LLMのトレーニングについてあまり語ってなくて、むしろ彼らが言われた通りにやっているだけってことを示してる気がする。

└

不条理さと明らかな風刺的意図を除けば、1. コードは実際に間違ってる（不条理な例外処理の状況に関係なく間違ってる） 2. 例外処理の一部は意味がない、または矛盾してる 3. プロンプトで例外処理に重点を置くと、実際に起こることがある（編集：現実のシナリオではよくある）

└

あの関数コードは、彼の体験を誇張して表現した皮肉な例だと解釈したんだ。だから、あの例では過度に慎重に指示されていたかもしれないけど、LLMのデフォルトがちょっと慎重すぎるのには同意するよ。

こういう専門的な初心者プログラムを「ドリブン開発」って呼んでる。実際、専門的な初心者が書いたコードが多いことがわかった。彼らは多くの指標で非常に生産的だからね。今のところ、すべてのSOTAエージェントは同時実行バグに対して異常に防御的になってる。おそらく、ドリブン開発に加えて、同時実行バグに関する警告がたくさんあるブログ記事が影響してるんだろう。

それは論理的に矛盾してるよね。ゼロで割ることは起こらないはずだ。だって、b=0ならabs(b) < sys.float_info.epsilonになるから。さらに、コードは事前チェックからNaNを返すことには問題ないけど、割り算からのNaN結果をNoneに置き換えてる。APIデザインの観点から見ると、全然意味がわからない。

あのコードには多くの問題があるけど、実際に一番気になるのは関数内にインポートを追加する傾向だね。どこかのプロセスで最小限の編集を最適化するための副産物だと思うけど、もっと良いものを期待してる。

└

インポートを遅延させて、起動時の遅いインポートの問題を解決するためだよ。

└

超大規模なプロジェクトでは、スタートアップ時間に大きく影響するから、できるだけレイジーイニシャライゼーションを使いたくなるよね。

└

これってRoPEアテンションのメカニズムに関係してると思う。コード内の物理的な近さが関連性のシグナルになってるんだよね。

なぜかわからないけど、FizzBuzzEnterpriseEditionを思い出した。 https://github.com/EnterpriseQualityCoding/FizzBuzzEnterpris...

└

え、あのプロジェクトでJUnit 4.8.3使ってたの？誰かが無茶してたな。法務部とCTOからの承認があったことを願うよ。ああいうカウボーイコーディングはキャリアに響くからね。

└

...フォルダとファイルがめっちゃ多い、見た後にダメージを受けた気分だ。素晴らしい皮肉だね。

Hacker Newsで議論の続きを見る

ハクソク

LLMは例外に対して致命的な恐怖を抱いている

概要

KarpathyによるAIエージェントの未来展望

Hackerたちの意見