概要
2025年のLLM分野を総括し、 推論モデル や エージェント の進化、 コーディングエージェント の台頭を解説。 CLI利用の普及や YOLOモード のリスク、 高額サブスクリプション の出現も注目点。 中国の オープンウェイトモデル の躍進や、 ローカル・クラウドモデル の進化も取り上げ。 各種ツールやサービスの実例を交え、 2025年のAIトレンド を網羅的に振り返る内容。 個人の体験や業界の空気感も交えた、 現場感覚に基づく総括。
2025年 LLM業界総括:主なトレンドと進化
-
推論(Reasoning)モデル の本格普及
- OpenAIが o1シリーズ で推論強化を先導
- RLVR(Reinforcement Learning from Verifiable Rewards) による性能向上
- 各社が推論モード搭載モデルをリリース
- APIで推論レベル調整可能なダイヤル機能普及
- ツール連携 による複雑なタスク処理能力の向上
-
エージェント の現実化
- エージェント= ツールを使いながら目標達成を目指すLLMシステム
- コーディングや検索など、実用的な分野で定着
- Deep Researchパターンや GPT-5 Thinking による詳細レポート生成
- “魔法のコンピュータ助手”像は未実現だが、 実作業支援ツール として普及
-
コーディングエージェント とClaude Code
- 2025年2月、 AnthropicのClaude Code が静かに登場
- LLMが コード生成・実行・結果検証・反復 まで自動化
- OpenAI、Google Gemini、Qwen、Mistralなど各社がCLI型コーディングエージェントを展開
- GitHub Copilot CLIやAmpなど、 ベンダーニュートラルなCLIツール も登場
- Zed、VS Code、CursorなどIDEとの連携強化
- 非同期型コーディングエージェント (Claude Code for web等)によるPull Request自動作成
- セキュリティ面では ローカルPCを汚さない設計 が評価
-
コマンドライン(CLI)でのLLM活用 の一般化
- 2024年からCLIツール開発が進む
- sedやffmpeg等の複雑なコマンドも LLMが自動生成
- Claude Codeは 年間10億ドル規模の収益 に到達
- CLI経由でのLLM利用が 開発者に広く浸透
-
YOLOモードとリスクの常態化
- 安全確認なしの自動実行(YOLOモード)が普及
- “Normalization of Deviance”現象による リスク感覚の麻痺
- セキュリティ研究者Johann Rehbergerによる警鐘
- Challenger事故の教訓に学ぶべき点
-
高額サブスクリプションモデル の出現
- Claude Pro Max 20x($200/月)、ChatGPT Pro($200/月)、Google AI Ultra($249/月)など
- トークン大量消費 する高度なタスクでのコストメリット
- ヘビーユーザー層に受け入れられる価格帯
- APIクレジット消費量の増加が背景
中国オープンウェイトモデルの台頭
- 2024年から中国発の 高性能オープンウェイトモデル が世界ランク上位に進出
- Baichuan、Qwen、DeepSeekなどの台頭
- 国際的な評価指標 での存在感増加
- オープンソース化による 研究・実装コミュニティの活性化
ローカルモデルとクラウドモデルの進化
- ローカルモデル の精度・速度が大幅向上
- しかし クラウドモデル も同時に進化し、依然としてトップ性能
- 用途や予算に応じた選択肢の多様化
新しいAI利用スタイルとツール群の拡大
- プロンプト駆動型画像編集 や 学術大会での金賞獲得 など応用範囲の拡大
- 110以上のツール開発 や スマホでのプログラミング など個人利用の深化
- AI搭載ブラウザ の普及と新たなリスク(“lethal trifecta”など)
- コーディングエージェントの非同期・並列活用 による生産性向上
2025年の総括と今後の展望
- 推論とエージェント化 によるLLMの実用性向上
- CLI・非同期処理 ・高額プランなど、 新しい利用パターンの定着
- セキュリティリスク と 利便性 のバランスが今後の課題
- 中国勢の台頭 や ローカル・クラウドの進化 などグローバルな競争激化
- 個人・組織のAI活用スタイル が多様化しつつある現状