ハクソク

世界を動かす技術を、日本語で。

ジェミニ-2.5-プロ-プレビュー-06-05

2025年6月6日原文(deepmind.google)

概要

Gemini 2.5 Pro は、コーディングと複雑なプロンプト処理で最先端を行くAIモデル。
マルチモーダル対応 や 長文コンテキスト処理 など、多様な入力形式と大規模データを扱える。
Deep Think による強化推論モード搭載で、並列思考技術を活用した高度な推論力を実現。
主要ベンチマークで高得点 を記録し、競合他社と比較して優れた性能を発揮。
Google AI Studio やAPIを通じて利用可能、幅広い開発用途に対応。

Gemini 2.5 Proの特徴

最先端のコーディング支援
- Web開発タスクのコード自動生成
- 1行プロンプトから実行可能なゲームやアニメーション作成
- 画像や動画をコード化し、動作シミュレーションを実現
マルチモーダル対応
- テキスト、音声、画像、動画の入力をネイティブで理解
- 24言語でシームレスな音声出力
- 音声出力は話し方のニュアンスまで反映
長文コンテキスト処理
- 最大 100万トークン の入力コンテキスト対応
- 大規模データセットの解析や複雑なプロンプト処理に最適
Deep Think（強化推論モード）
- 並列思考など最新の推論研究成果を活用
- 複雑な問題や高度な推論タスクで高いパフォーマンス
ベンチマークでの優位性
- 数学・科学分野（AIME, GPQA等）で高スコア
- コード生成・編集・エージェンティックコーディングタスクで競合を上回る
- 事実性や画像・動画理解、長文コンテキスト処理でも高評価

ベンチマーク・パフォーマンス比較

主要AIモデルとの比較
- OpenAI o3 High, Claude Opus, Grok 3 Beta, DeepSeek R1等と比較し、高い精度とコストパフォーマンス
- Reasoning, Coding, Factuality, Visual Reasoning, Long Contextなど多角的な評価軸でリード
コスト
- 入力：100万トークンあたり1.25ドル
- 出力：100万トークンあたり10ドル
- 競合他社と比較してコスト効率の高さ
対応データ形式・トークン数
- 入力：テキスト、画像、動画、音声（最大100万トークン）
- 出力：テキスト（最大64,000トークン）

利用可能な環境・用途

Google AI Studio ・ Gemini API ・ Gemini App で提供
理由推論 ・ コーディング ・ 複雑なプロンプト への最適化
実行可能なコード生成 や インタラクティブなシミュレーション の作成
開発者・研究者向けの強力なAIツール として活用可能

まとめ

Gemini 2.5 Pro は、コーディングや複雑な推論が求められる現場で圧倒的な性能を発揮
マルチモーダル対応 と 長文処理能力 で幅広いニーズに対応
Google AI Studio 等を通じて、誰でも最新AIの力を活用可能

Hackerたちの意見

いろんな日付がついたプレビュー版を出し続けるんじゃなくて、パッチ版を追加してそれを更新すればいいのにって思う。

└

誰かがそのバージョンを使って何かを作ってるかもしれないから、新しいモデルに置き換えたくないんだよね。

Aiderで82.2、まだo3 highの公式スコアに追いついてないね。 https://aider.chat/docs/leaderboards/

└

82.2は他のモデルの「正解率」に対応してるのかな？OpenAIがO3を更新したかは分からないけど、リンクされた表を見ると「純粋な」o3（high）は79.6%のスコアがあるみたい。「o3（high）+ gpt-4.1」のコンボが最高スコアの82.7%だね。前のGemini 2.5 Pro Preview 05-06（そう、今の06-05じゃない！）は76.9%だった。これは結構いい上昇だね！でも、これらのAiderのベンチマークは今のところ一番役に立つ/信頼できるベンチマークみたいで、実際に注目してるのはこれだけだよ。

└

それは今日の新しいプレビューじゃなくて、古い05-06のプレビューだよ。

└

でも、めっちゃ安くて早い。すごいよね。

同じモデルのプレビュー版が3つもあって混乱するのに、最後の2つの日付が05-06と06-05って、もうちょっと待てばよかったのに:)

└

あの日付は曖昧だから、13日まで待たなきゃいけなかっただろうね。カナダでは、見かける日付の1/3がイギリスのもので、もう1/3がアメリカのものだから、ほんとに混乱するよ。ありがたいことに、y-m-d形式が今や合法なフォーマットになって、少しずつ浸透してきてるみたい。

└

エンジニアって、意外と物の名前を付けるのが下手だよね！

└

最後の2つの日付は05-06と06-05で、明らかにOpenAIの4oとo4モデルを挑発してるね。

└

いつになったらGemini 2.5 ProからGemini 2.6 Proに移行するんだろう？Gemini 3はもっと大きなモデルになると思うけど。

これがClaude 4 Sonnetとコードでどう比較されるのか気になるな。この表を見ると、かなり劣ってるみたい？ https://blog.google/products/gemini/gemini-2-5-pro-latest-pr...

Hacker Newsで議論の続きを見る