LLM構造化出力ハンドブック

2026年1月16日原文(nanonets.com)

概要

LLMの構造化出力 はプログラム利用時に重要な課題
確実な構造化出力 を実現する手法とツールの紹介
開発・運用・最適化 に関する実践的なガイド
最新動向を反映した 包括的なハンドブック
Nanonets-OCR や docstrange の開発者による執筆

LLMの構造化出力と課題

LLM（大規模言語モデル） はJSONやXML、コードなど 構造化出力 を生成可能
しかし 確率的生成 のため、時折 構文エラーや不正な出力 が発生
データ抽出、 コード生成、 ツール連携 などで 構造化出力の信頼性 が重要
構造化出力が保証されなければ 自動化やエージェント活用 は実現困難

構造化出力を保証する方法

決定論的手法 による構造化出力の強制
- 出力テンプレート の利用
- 構文チェッカー による検証
- ツール連携 による自動修正
ベストプラクティス や 最新ツール の選定基準
システム構築・運用・スケーリング のノウハウ
レイテンシやコスト最適化 の手法
出力品質向上 のための工夫

ハンドブックの特徴と活用方法

構造化生成分野 は急速に進化、既存リソースは 陳腐化が早い
学術論文、ブログ、GitHubリポジトリ など多様な情報の統合
定期的に更新 される リビングドキュメント
最初から通読、または リファレンス としての利用が可能

著者・運営元について

Nanonets-OCR （VLMで文書をMarkdownへ変換）開発チーム
docstrange （オープンソース文書処理ライブラリ）開発者
LLM開発者コミュニティ からの知見・最新情報を配信
- ニュースレター で月2回のアップデート
- 最新ブレークスルー や 有用ツール の紹介

まとめ

LLMの構造化出力 の信頼性・効率化を目指す開発者向けハンドブック
最新技術動向 と 実践手法 を一冊に集約
開発・運用・最適化 に役立つ必携リソース

Hackerたちの意見

いいガイドだね。特にこのページのマスクされたデコーディング図が好きだな。https://nanonets.com/cookbooks/structured-llm-outputs/basic-.... 追記：なんかそのリンクがうまくいかない…「制約付きメソッド」のページの図だよ。

└

ここにいる著者の一人だよ。図のリンクをチェックしてみるね。商業モデルの提供者はみんな構造化された出力を追加してるから、ガイドもどんどん更新していくよ。

これは本当に美しいガイドだね。まとめてくれてありがとう！いろんなページのタブスルーアニメーションが特に好きだし、これまで見た中で一番の説明だと思う。文法制約付き生成については結構理解してるつもりだけど（llama.cppの文法実装にいくつかの貢献を統合したことがある）、それでも君のイラストからいくつかの洞察を得られたよ。ありがとう！もっと多くの人がこの機能を理解できるように手助けしてくれて嬉しい。どう機能するのか、効果的に使う方法もね。構造化された出力はLLMエンジンの中で最も過小評価されている機能の一つだと思うし、もっと使われるべきだよ。制約付き非決定性のおかげで、LLMを大きなパイプラインやプロセスの一部として信頼して使えるし（例えば、ツール呼び出しをするエージェントなど）、文法エラーや「もちろん！これは他のテキストや前置きなしでJSON形式にフォーマットされた出力です」といったメッセージが混ざることもない。君のLLM出力が正しいとは限らないけど、文法があれば少なくとも文法的には正しい出力が保証される。全てではないけど、何もないわけじゃないし。特にクラウドデプロイから離れて効果的なローカルモデルを運用したいなら、文法は非常に価値のある要素だよ。実用的な例としては、JartのRaspberry Pi上で動くシンプルなLLMベースのスパムフィルターの例をよく思い出す。 [0]: > llamafile -m TinyLlama-1.1B-Chat-v1.0.f16.gguf \ > --grammar 'root ::= "yes" | "no"' --temp 0 -c 0 \ > --no-display-prompt --log-disable -p " > このメールがスパムであると確信を持って言えますか？ ... すごく小さなハードウェアでも、出力を「yes」か「no」に制約する文法を含めることで、システムが別の結果を出すことは不可能になるから、超小型モデルを超限られたハードウェアで使えるし、それでも役に立つ。スパムを正しく識別できるわけじゃないかもしれないけど、文法的な理由で壊れることはないから、小さくてローカルなモデルの有用性が大きく向上するよ。

└

モデルが他のものを返したいときはどうなるの？llamafileでやるのと、呼び出しているラッパーでやるのとでは何が良くて何が悪いの？リトライをどう設定するの？JSONと範囲が欲しいときはどうすればいいの？

JSONよりも信頼性が高い（スキーマへの適合が良い、パース可能な出力が得やすい）か、安価（トークン数が少ない）な出力形式ってある？YAMLには独自の問題があるし、TOMLはあまり普及してないけど、どちらも生成しやすそうだよね。みんなは何を試したの？

└

そう、それがTOONの目的だよ。https://github.com/toon-format/toon

└

正規表現を使ってXMLスキーマを強制して、その後普通のXMLパーサーでデコードしてるよ。コードにはXMLの方が良いし、特にコード部分ではcdataを強制してるから、LLMはエスケープなしで自由にできるんだ。OpenAI APIは正規表現で構造化された出力を可能にしてて、コードにはJSONよりもずっといいよ。

└

ちょっとブレインストーミングしてみる。人間はJSONを書くのが難しいんだよね、だってめんどくさいから。厳しすぎるし。私の経験では、人間がTypeScriptを書く方が、JSONを直接書くよりずっと良いよ。コメントも書けるし、可読性を高めるための末尾のカンマも許されるしね。だから、LLMに生成させる面白いファイルは、最終的なファイルの代わりに最終ファイルを作成するプログラムとかかも？もちろん、セキュリティの問題があるけど、LLMが生成するプログラムはちゃんとサンドボックス化されて、DOS攻撃や爆発的な出力サイズを防ぐために時間制限も必要だし、最終結果のCPU使用量も考えないといけないけど、品質的にはどうなんだろう？

└

自分のケースに特化した評価をするべきだよ。私の評価では、XMLは配布外タスクにおいて全てのモデルでJSONを上回ってる（つまり、データに含まれていたJSONではなく）。

モデルが毎回有効なJSONを出力することを信頼できないなら、エージェントを構築するのは基本的に不可能だと思う。これは、プロダクションシステムのために決定論的な構造を強制するための現在の技術の良いコレクションだね。

とてもよく書かれたガイドだね！著者や読者がガイダンスとllguidanceの最適化に関する技術的な詳細に興味があれば、ここにちょっとした論文を書いたよ。https://guidance-ai.github.io/llguidance/llg-go-brrr

これは素晴らしいガイドだね！博士課程の時に構造化生成についてたくさん研究したよ。他にも興味がある人のためにいくつかのポイントを挙げておくね。いくつかのライブラリ： - Outlines、構造化生成のための素敵なライブラリ - https://github.com/dottxt-ai/outlines - Guidance（このスレッドでFlyingLawnmowerが既に触れてる）、もう一つの素敵なライブラリ - https://github.com/guidance-ai/guidance - XGrammar、機能は少ないけど、制約された生成のために本当に最適化されたライブラリ - https://github.com/mlc-ai/xgrammar - これは面白い技術的な側面がたくさんあって、興味深いプロジェクトだよ。いくつかの論文： - 大規模言語モデルのための効率的なガイド生成 - Outlinesの著者によるもので、おそらく最初の本格的なLLM制約生成の論文 - https://arxiv.org/abs/2307.09702 - 言語モデルデコーディングのためのオートマタベースの制約 - 制約生成と実装についてのもっと技術的な論文 - https://arxiv.org/abs/2407.08103 - オートマタベースのサブワードレベル制約生成における落とし穴、微妙な点、技術 - ちょっと自己宣伝。制約生成がどこで間違えるかを示し、実務者向けのいくつかの技術について話してる - https://openreview.net/pdf?id=DFybOGeGDS いくつかのブログ記事： - 正規表現制約を使った高速・高忠実度のLLMデコーディング - 標準的なトークン化に従うことについて話してる（つまり、単に制約だけでなく、トークナイザーによって生成されるものも） - https://vivien000.github.io/blog/journal/llm-decoding-with-regex-constraints.html - Coalescence: LLM推論を5倍速くする - Outlinesチームからのもの - 制約生成中に有効なトークンが一つだけの時に推論をスキップすることについて - https://blog.dottxt.ai/coalescence.html

Hacker Newsで議論の続きを見る

ハクソク