概要
- OpenAI と Google DeepMind がICPC WF 2025でAIモデルの金メダル級パフォーマンスを発表
- 両社とも「I'm excited to announce/share」と題したツイートを5分差で投稿
- OpenAIのモデルは全12問を解き、DeepMind(Gemini)は10問を解答
- ICPC公式もこれを認めており、AIによる人間超えの歴史的瞬間
- 結果の信頼性や環境条件、一般公開時期などに議論が集中
ICPC WF 2025でのAIの歴史的快挙
- OpenAI と Google DeepMind が同時期にICPC World Finals 2025でAIモデルの成果を発表
- 両社のツイート(HengTze, MostafaRohani)が話題
- OpenAI モデルは全12問を解答、 DeepMind (Gemini)は10問を解答
- OpenAIは「ICPC oversight」下で全問題を解決
- DeepMindは人間+Geminiチームで10問解答との見方も
- ICPC公式サイトでも両社の成果を掲載
- OpenAIの「全問正解」はAIが人間を超えた初のメジャーCP大会とされる
成果の詳細・議論点
- OpenAIは11問を初回提出でAC、最後の1問のみ9回提出でAC
- DeepMindは10問で17回提出
- ICPCでは失敗テスト番号は非公開、判定はWA/TLE/ACのみ表示
- AIによる「チート」や不正の可能性は低いと見られる
- OpenAIは「特別なAIテスト環境」で実施、DeepMindは「本番ミラー環境」で実施
- OpenAIの方が条件的に有利だったとの指摘
- コストや一般公開の時期、モデルの最適化、再現性に関する議論が続く
- 一部では「実験用モデル」や「アンサンブル利用」などの主張に懐疑的な反応も
競技プログラミング(CP)界隈の反応
- 「Kasparov vs Deep Blue」の再来と例える声
- AIの進化が人間のトップCPプレイヤーを超えたことへの驚きと危機感
- IOIやAtCoderなど他大会との比較・評価
- ICPCの提出制限やジャッジ方法の違いがAIに有利に働いた可能性
- 「CodeJam復活を」など、AIの進化を歓迎しつつも人間主体の大会を求める声も
今後の展望・課題
- AIモデルの一般公開時期や利用コストへの関心
- 公開バージョン(GPT-5など)と実験バージョンの性能差
- AIによる解答戦略(並列処理、テストケース推測など)の透明性
- 人間とAIの共存、CP大会の今後のルール整備や運営方法の課題
- 投資家向けアピールや「成果の正当性」への疑問も根強い