今のところの私の経験(弁護士とソフトウェアエンジニアの両方として)では、コードや法的文書を作成する際のLLMのエラー率はかなり似ているけど、法的文書の方が問題が多いんだ。法的文書にはコードにあるような構造的な安全策がないからね。法的文書には自動テストも静的型付けもテスト環境もログ記録も観測機器もサンドボックスもない。ドラフトから「デプロイ」までのタイムラグも、効果的で高価なデバッグループを作る要因になっている。コードは数秒で本番環境にデプロイできて、エラーがログに表示されたらすぐにデバッグを始められるけど、契約書や裁判所の提出書類のエラーが見つかるまでには最低でも数日、時には数年かかることもある。その時点でエラーは修正不可能なことが多いから、エラーは発見も解決も難しいし、誤りの結果はしばしば大きい。法的なエラーは誰かの命や自由、重要な財産を危険にさらすことがあるからね。もちろん、特定の安全クリティカルなシステムのバグは法的ミスよりも悪いこともあるけど、一般的にはほとんどのソフトウェアは法的文書よりリスクが低い。逆に、LLMは法的文書の基本的なスタイルや構造についてはコードよりも良い仕事をしているように見える。IRACフォーマットに従ったり、法律の主張を引用したり(幻覚の問題は残るけど)、分かりやすい文を書いたりね。これはコードにおける良いコメントや一貫したデザインパターンの使用、テストカバレッジ、明確な変数名、DRYなどのベストプラクティスに相当する。これらの質的な指標でのパフォーマンスが良いのは、法的文書が通常、構造がシンプルでテキストの行数が少ないからかもしれないし、LLMが自然言語テキストで訓練されているからかもしれない。あるいは自然言語はコードよりも寛容で、言葉や文法の小さな違いが文書の解釈に大きな影響を与えないからかもしれない。一方、コードでは一文字のエラーが大きな影響を及ぼすことがあるからね。