概要
- Google DeepMind のGemini Deep Thinkが IMO 2025 で金メダル基準を達成
- 自然言語 のみで厳密な証明を生成、4.5時間以内に5問完全正解
- Deep Thinkモード による高度な並列推論と強化学習技術の活用
- 数学界との連携を通じて AIによる数学進歩 への貢献を目指す
- 今後は AI Ultra ユーザーや数学者向けにモデルを展開予定
IMO 2025でのGemini Deep Thinkの画期的成果
- International Mathematical Olympiad(IMO) は1959年から毎年開催される世界最高峰の高校生数学コンテスト
- 各国から6名の精鋭が参加し、 代数・組合せ・幾何・数論 の超難問6題に挑戦
- 上位半数にメダル、上位約8%が金メダルを獲得
- 近年、 AIの数学的推論能力 の試金石としても注目
- 2024年は AlphaGeometry 2/AlphaProof が4問正解・銀メダル相当(28点)を達成
- 2025年は Gemini Deep Think が5問完全正解・35点で金メダル基準を突破
- IMO公式採点者が「 明確・精密・理解しやすい」と高評価
- 2024年のAIは 専門言語変換 と2~3日かかる計算が必要だったが、2025年は 自然言語のみ ・4.5時間内で完結
Deep Thinkモードの技術的特徴
- Gemini Deep Think は複雑な問題に対応するための強化推論モード
- 並列的思考 で複数の解法を同時に探索・統合し最適解を導出
- 強化学習 とマルチステップ推論・定理証明データで追加学習
- IMO問題へのアプローチ法や高品質な数学解答例も学習データに追加
- 今後、信頼できる数学者や Google AI Ultra 契約者向けに段階的公開予定
AIと数学の未来
- Google DeepMind は数学コミュニティとの連携を継続
- AIの柔軟かつ直感的な推論能力の向上を目指す
- 自然言語推論 と 形式的証明(AlphaGeometry/AlphaProof) の双方を強化
- 自然言語流暢性と厳密な形式的推論を兼ね備えたAIは、数学者や研究者の貴重なツールとなる可能性
- AGI(汎用人工知能) への道筋として数学分野でのAI活用を推進
主要開発メンバー・関係者への謝辞
- Thang Luong がGemini Deep Thinkの技術指導とIMO 2025全体調整を担当
- Dawsen Hwang, Junehyuk Jung が学習データと専門家評価を主導
- Jonathan Lee, Nate Kushman, Pol Moreno, Yi Tay がGemini Deep Thinkの学習を担当、 Lei Yu が評価を指揮
- Golnaz Ghiazi, Garrett Bingham, Lalit Jain がDeep Think推論、 Vincent Cohen-Addad らが推論手法を強化
- AlphaGeometry チームや形式数学分野の専門家、評価・インフラ・法務・運用・計算資源・プログラムサポートなど、多数の専門家が貢献
- IMO理事会 のProf. Gregor Dolinarからも公式な支援と承認
IMO公式コメントと今後の課題
- IMO審査員が 提出解答の完全性と正確性 を公式に認定
- ただし、 システム全体やモデルの検証は対象外 であることに留意
- 今後はさらなるAIの数学的能力向上と、幅広い分野への応用が期待