概要
- GPT-5 はOpenAIのAPIプラットフォームでリリースされた最新のAIモデル
- コーディングやエージェントタスクで 最先端の性能 を発揮
- フロントエンド開発 や長時間の複雑なエージェント作業にも強み
- 新しいAPIパラメータで 応答の制御性 が向上
- gpt-5, gpt-5-mini, gpt-5-nano の3サイズ展開で柔軟な選択肢
GPT-5の登場と特徴
- GPT-5 はAPIプラットフォーム向けにリリースされたOpenAIの最新モデル
- コーディングやエージェントタスクで 最先端(SOTA) のスコア達成
- SWE-bench Verifiedで 74.9%
- Aider polyglotで 88%
- バグ修正やコード編集、複雑なコードベースの質問対応が得意
- 詳細な指示 に高精度で従うステアラブルな設計
- フロントエンド開発 でOpenAI o3を70%の確率で上回る実績
- スタートアップやエンタープライズとの協力による 実践的なタスク学習
- Cursor や Vercel などから高評価を獲得
エージェントタスクとツール連携の進化
- 長時間・複雑なエージェントタスク でSOTA達成
- τ2-bench telecomで 96.7% のスコア
- 複数ツールの連携 (直列・並列)を高精度で実行
- ツール指示の厳密な遵守 とエラー対応力の向上
- 長文コンテキストからの 情報検索能力 の強化
- Manus や Notion など企業からの高評価
新API機能とモデルバリエーション
- 応答の長さを調整できる verbosityパラメータ 追加
- reasoning_effortパラメータ で推論量を最小化し高速応答が可能
- カスタムツール 対応で、JSON以外のプレーンテキスト呼び出しもサポート
- gpt-5, gpt-5-mini, gpt-5-nano の3種で性能・コスト・レイテンシの選択肢
- ChatGPT内のGPT-5はシステム的に異なる構成
コーディング分野での性能
- SWE-bench Verifiedで o3より高スコア かつ効率的
- 出力トークン22%減、ツールコール45%減
- Aider polyglotで エラー率1/3に削減
- 複雑なコードベースの理解力 と質問対応力
- Webアプリのフロントエンドコード 生成で美的・技術的に高評価
- Cursor、Windsurf、GitHub Copilot、Codex CLI などでの実績
エージェントタスクでの進化
- 指示追従性能 が大幅向上(COLLIE, Scale MultiChallengeで高得点)
- ツールコールの精度・柔軟性 が向上
- 進捗報告や中間要約 も自動で出力可能
- τ2-bench telecomで 97% の記録的スコア
長文コンテキスト・ファクトチェックでの強化
- OpenAI-MRCR で長文情報検索性能が大幅向上
- BrowseComp Long Context ベンチマークをオープンソース化
- 128K–256Kトークンの入力で 正答率89%
- 最大272,000トークンの入力 と 128,000トークンの出力 に対応
- LongFact, FactScore で80%の事実誤り削減
安全性と自己認識の向上
- 自己の限界認識 と予期せぬ質問への対応力の強化
- ヘルスケア関連の質問 でも高精度
- 高リスクな利用時は 検証推奨
新しいAPIパラメータの使い方
- reasoning_effort で推論時間・品質を調整
- minimalで高速応答、highで高品質応答
- verbosity で応答の長さを制御
- 明示的な指示がある場合はそちらを優先
このように、 GPT-5 はコーディング・エージェントタスク・長文処理・安全性の全てで大幅な進化を遂げており、 開発者の多様なニーズに柔軟に対応 できる新しいAI基盤として注目されています。