2025年：LLMの年

2026年1月1日原文(simonwillison.net)

概要

2025年のLLM分野を総括し、 推論モデル や エージェント の進化、 コーディングエージェント の台頭を解説。 CLI利用の普及や YOLOモード のリスク、 高額サブスクリプション の出現も注目点。中国の オープンウェイトモデル の躍進や、 ローカル・クラウドモデル の進化も取り上げ。各種ツールやサービスの実例を交え、 2025年のAIトレンド を網羅的に振り返る内容。個人の体験や業界の空気感も交えた、 現場感覚に基づく総括。

2025年 LLM業界総括：主なトレンドと進化

推論（Reasoning）モデル の本格普及
- OpenAIが o1シリーズ で推論強化を先導
- RLVR（Reinforcement Learning from Verifiable Rewards） による性能向上
- 各社が推論モード搭載モデルをリリース
- APIで推論レベル調整可能なダイヤル機能普及
- ツール連携 による複雑なタスク処理能力の向上
エージェント の現実化
- エージェント＝ ツールを使いながら目標達成を目指すLLMシステム
- コーディングや検索など、実用的な分野で定着
- Deep Researchパターンや GPT-5 Thinking による詳細レポート生成
- “魔法のコンピュータ助手”像は未実現だが、 実作業支援ツール として普及
コーディングエージェント とClaude Code
- 2025年2月、 AnthropicのClaude Code が静かに登場
- LLMが コード生成・実行・結果検証・反復 まで自動化
- OpenAI、Google Gemini、Qwen、Mistralなど各社がCLI型コーディングエージェントを展開
- GitHub Copilot CLIやAmpなど、 ベンダーニュートラルなCLIツール も登場
- Zed、VS Code、CursorなどIDEとの連携強化
- 非同期型コーディングエージェント （Claude Code for web等）によるPull Request自動作成
- セキュリティ面では ローカルPCを汚さない設計 が評価
コマンドライン（CLI）でのLLM活用 の一般化
- 2024年からCLIツール開発が進む
- sedやffmpeg等の複雑なコマンドも LLMが自動生成
- Claude Codeは 年間10億ドル規模の収益 に到達
- CLI経由でのLLM利用が 開発者に広く浸透
YOLOモードとリスクの常態化
- 安全確認なしの自動実行（YOLOモード）が普及
- “Normalization of Deviance”現象による リスク感覚の麻痺
- セキュリティ研究者Johann Rehbergerによる警鐘
- Challenger事故の教訓に学ぶべき点
高額サブスクリプションモデル の出現
- Claude Pro Max 20x（$200/月）、ChatGPT Pro（$200/月）、Google AI Ultra（$249/月）など
- トークン大量消費 する高度なタスクでのコストメリット
- ヘビーユーザー層に受け入れられる価格帯
- APIクレジット消費量の増加が背景

中国オープンウェイトモデルの台頭

2024年から中国発の 高性能オープンウェイトモデル が世界ランク上位に進出
Baichuan、Qwen、DeepSeekなどの台頭
国際的な評価指標 での存在感増加
オープンソース化による 研究・実装コミュニティの活性化

ローカルモデルとクラウドモデルの進化

ローカルモデル の精度・速度が大幅向上
しかし クラウドモデル も同時に進化し、依然としてトップ性能
用途や予算に応じた選択肢の多様化

新しいAI利用スタイルとツール群の拡大

プロンプト駆動型画像編集 や 学術大会での金賞獲得 など応用範囲の拡大
110以上のツール開発 や スマホでのプログラミング など個人利用の深化
AI搭載ブラウザ の普及と新たなリスク（“lethal trifecta”など）
コーディングエージェントの非同期・並列活用 による生産性向上

2025年の総括と今後の展望

推論とエージェント化 によるLLMの実用性向上
CLI・非同期処理 ・高額プランなど、 新しい利用パターンの定着
セキュリティリスク と 利便性 のバランスが今後の課題
中国勢の台頭 や ローカル・クラウドの進化 などグローバルな競争激化
個人・組織のAI活用スタイル が多様化しつつある現状

ハクソク