予算制約下における適応型LLMルーティング

2025年9月2日原文(arxiv.org)

概要

LLM routingは、各クエリに最適なLLMを動的選択する技術
従来は完全なクエリ-LLM対応情報が必要な教師あり学習が主流
現実では全ての最適対応情報が得られず、クエリも進化
本研究は文脈付きバンディット問題としてLLM routingを再定義
PILOT手法とコスト最適化ポリシーで効率的なモデル選択を実現

LLM routingの課題と新提案

Large Language Models (LLMs) は自然言語処理を革新
LLMごとの 能力差・コスト差 が実運用の障壁
LLM routingは クエリごとに最適なLLMを選択 する技術
従来手法は 教師あり学習 で全てのクエリ-LLM最適対応を前提
- 現実では 完全な対応マッピングが得られない 課題
- ユーザーのクエリも 進化・多様化 する現状
本研究は 文脈付きバンディット問題 としてLLM routingを再定義
- 全LLMでの推論不要 な適応的意思決定を実現

提案手法：PILOTとコスト最適化

クエリとLLMの 埋め込み空間 を新たに設計
- Affinity（親和性） に基づきクエリ・LLM埋め込みを整列
- オフラインの人間評価データ で初期学習
- オンラインのバンディットフィードバック で継続的に精緻化
Preference-prior Informed Linucb fOr adaptive rouTing (PILOT)
- LinUCBの拡張手法として実装
- 適応的なLLM選択 を実現
ユーザーごとの 予算制約 に対応
- マルチチョイスナップサック問題 としてコストポリシーを設計
- リソース効率 を意識したルーティングが可能

まとめ・応用可能性

PILOTは 教師あり学習型ルーティング よりも柔軟・効率的
コストと精度のバランス を動的に最適化
現実の多様な運用シナリオ に適応可能
本研究は EMNLP 2025 findings として採択
機械学習・AIサービス運用における LLM活用最適化 への貢献

Hackerたちの意見

人間の好みデータが必要な理由ってあるの？LLMは質問の複雑さを理解するのに十分な能力があるから、ルーティング用のデータセットを作れるんじゃないの？

└

質問の複雑さを理解する能力、つまり知恵。いいえ、LLMにはそれがないよ。僕もそうだし、通常はそれを見つけるために深い穴に飛び込まなきゃいけない。

└

LLMは概念を持ってないよね。人間のテキストの膨大なデータベースに対してパターンをマッチさせてるだけ。

└

誰かにサンドイッチを作ってもらうのに、自分の頭の中を読んでほしいって言ってるようなもんだね。

これがLLM研究の最前線なの？そうなると、AGIは当分無理そうだね。正直、未来について少し安心できるかも。追記：実際にLLMからAGIが出るとは思ってなかったよ。あれは皮肉だった。LLMの性能向上が頭打ちになってるのは注目すべきだと思う。

└

僕もこれについてはよくわからないな。2023年にはこれが最前線になると思ってたのに。

└

まず、AGIには絶対に到達しないと思う。大きな進展はまだ見られると思うけど、AGIは曖昧で動き続ける目標だから、合意には至らないよ。でも、この論文が君の考えにどう影響を与えるの？予算についてや、異なるLLMが異なるコスト構造を持っていることを認識することについての話だよ。絶対的にLLMの性能を向上させようとしているわけじゃない。

└

「AGI」の瞬間は来ないんじゃないかと思い始めてる。時間をかけて徐々に賢い機械を作っていくうちに、気づいたら「AGI」が存在するって感じになるかも。90年代のビデオ通話みたいに、みんな欲しがってたけど、今はみんな嫌がってる、笑。

└

LLMはAGIへの道を歩んでるわけじゃないけど、それでも危険はたくさんあるよね。

└

それに、LLMはどうやら停滞してるみたい。今年の初めには、大手企業が毎週のように目に見える改善を発表してたのに。数週間がAIの世界では「永遠」だって冗談を言ってたけど、今はどれくらいの時間が経ってるんだろう？

└

arxivに載ってるからって、特別な意味があるわけじゃないよ。arxivは基本的に学術的なフォーマットのブログみたいなもので、アジアや南アジアの学術コミュニティでは人気なんだ。今はこれを使って評判を洗浄できるけど、これは暗号の世界での「ホワイトペーパー」が資本を生むのと同じようなもので、みんなが気づくにつれてその力は弱まっていくよ。

└

富士通リサーチのランダムな論文が、何かの最前線を主張してるの？

Hacker Newsで議論の続きを見る

ハクソク

予算制約下における適応型LLMルーティング

概要

LLM routingの課題と新提案

提案手法：PILOTとコスト最適化

まとめ・応用可能性

Hackerたちの意見