概要
- ChatGPTが自身の仮想コンピュータを使い、複雑な業務を自動で完結できる新機能の提供開始
- ウェブ操作、分析、資料作成など様々なタスクを一貫して実行可能
- ユーザーは常に操作をコントロールでき、安全性にも配慮
- Pro、Plus、Teamユーザーが“agent mode”で利用可能
- 今後も継続的な機能強化を予定
ChatGPTの新しいエージェント機能の概要
- ChatGPTが 仮想コンピュータ を用いて、 業務の自動化 を実現
- ウェブサイトの閲覧、情報収集、フィルタリング、ログイン操作等の 一連の作業 を自律的に遂行
- スライド資料やスプレッドシートの作成、コードの実行、データ分析など 多様なアウトプット の自動生成
- Operatorのウェブ操作能力、deep researchの情報統合力、ChatGPTの 会話力 を融合した 統合エージェントシステム
- ユーザーの指示に基づき、 推論と実行を柔軟に切り替え て複雑なワークフローを完結
利用方法とコントロール
- Pro、Plus、Teamの各プランで composerのツールドロップダウンから“agent mode” を選択して有効化
- 会話中いつでも“agent mode”を切り替え可能
- ChatGPTによる 重要な操作前には必ずユーザーの許可 を要求
- 作業進行中に 中断・ブラウザ操作の引き継ぎ・停止 が可能
- 完了時には スマートフォンアプリで通知 を受け取れる
機能の進化と技術的特徴
- Operatorの ウェブ操作 とdeep researchの 分析・統合力 を一体化
- グラフィカルブラウザ、 テキストベースブラウザ、 ターミナル、 API連携 など多様なツールを搭載
- GmailやGithub等のコネクタ を活用し、アプリ連携や必要情報の取得が可能
- 複数のツールを組み合わせて 最適な経路でタスクを完遂
- コンテキストを維持 しつつ、タスクの途中で手法やツールの切替えが可能
実際の活用例
- カレンダーを参照し、 最新ニュースに基づいた会議要約 を自動生成
- 日本食朝食の材料購入・レシピ提案・買い物リスト作成 の自動化
- 競合調査の 分析とスライド資料作成 を一括実行
- スプレッドシート編集、ダッシュボードからのプレゼン資料作成、会議日程調整 など業務効率化
- 旅行計画、パーティー企画、専門家検索・予約 など日常生活での利用
タスク進行とコラボレーション
- 作業中に 指示の追加・修正・中断 が可能な インタラクティブなワークフロー
- ChatGPTが 追加情報の確認や進捗報告 を自発的に行う
- タスクが長引く場合、 進捗サマリーの要求や途中結果の取得 が可能
- タスクの自動定期実行 (例:毎週月曜のレポート生成)も設定可能
性能評価とベンチマーク
- Humanity’s Last Exam(HLE) でSOTA(state-of-the-art)を達成
- FrontierMath で専門家レベルの難問において高い精度を記録
- DSBenchやSpreadsheetBench 等の実務タスク系ベンチマークで人間を上回る性能
- 投資銀行アナリスト業務、競合分析、財務モデリング 等の専門業務でも高評価
- BrowseComp、WebArena 等のウェブ情報検索系ベンチマークでも従来モデルを大幅に超える結果
セキュリティとリスク対策
- ユーザーデータやコネクタ経由の情報 を直接操作するため 新たなリスク が発生
- Operatorでの研究プレビューで培った 堅牢なコントロールと追加のセーフガード を実装
- プロンプトインジェクション攻撃 (悪意ある指示注入)への耐性強化
- ウェブ上の隠れた命令による 意図しない操作や情報漏洩リスク の低減
- 重要な操作には都度ユーザーの明示的な確認 を要求し、被害リスクを最小化
今後の展望
- 現時点でも 強力な業務自動化ツール として活用可能
- 今後も 定期的な機能強化と新ツールの追加 を予定
- より多くのユーザーや業界での実用性向上 を目指す
参考:
- 各種ベンチマークや技術詳細はOpenAI公式発表および関連資料を参照