ジェミニ 3.1 プロ

2026年2月20日原文(deepmind.google)

概要

Gemini 3.1 Pro はGoogleの最先端マルチモーダルAIモデル
複雑な推論・マルチモーダル処理 に優れた性能
安全性・倫理性 を重視した評価と対策を実施
既知の制限やリスク、緩和策についても明記
Frontier Safety Framework に基づく厳格なリスク管理

Gemini 3.1 Pro モデルカード（2026年2月公開）

Gemini 3.1 Pro はGemini 3シリーズの最新モデルであり、Googleによる最も高度な推論・マルチモーダル対応AI
テキスト、画像、音声、動画、コードリポジトリ など多様な情報源を理解可能
入力： 最大100万トークンの文脈ウィンドウ、テキスト・画像・音声・動画対応
出力： 最大64Kトークンのテキスト生成
Gemini 3 Pro をベースとしたアーキテクチャ・データセット設計

評価とベンチマーク結果

推論力・マルチモーダル能力・多言語性能・長文文脈処理 など多岐にわたるベンチマークで評価
Gemini 2.5 Pro を大きく上回る性能を発揮
- 例： ARC-AGI-2（抽象的推論）で77.1%、 GPQA（科学知識）で94.3% など
競合モデル（GPT-5.2, GPT-5.3-Codex, Sonnet 4.6, Opus 4.6） とも比較し、複数分野で優位性を示す

想定用途と制限事項

現実世界の複雑な課題解決、高度な推論や知性、創造性、戦略的計画を要する場面に適応
エージェント的な自律動作、高度なコーディング、長文脈・マルチモーダル理解、アルゴリズム開発に最適
既知の制限事項・利用規約 についてはGemini 3 Proモデルカードを参照

安全性・倫理性評価

自動化・手動双方の安全性評価 を実施
- テキスト・画像・多言語安全性で Gemini 3.0 Proと同等以上 の結果
- 不当な拒否応答の抑制、敏感なトピックでの適切なトーン維持
子ども保護・有害コンテンツ対策 に関しても専門チームによる評価をクリア
リスク・緩和策、詳細はGemini 3 Proモデルカード参照

Frontier Safety（最先端リスク管理）

Frontier Safety Framework に基づく厳格なリスク評価を実施
- CBRN（化学・生物・放射線・核情報）、 サイバー、 有害操作、 機械学習R&D、 ミスアライメント の5分野で評価
Deep Thinkモード 含む各分野でCCL（クリティカル能力レベル）には未到達
- サイバー分野では警告閾値到達も、CCLは未到達
- 他分野でも 緩和策を継続展開
継続的なテスト・能力ジャンプ検知 による安全性確保

まとめ

Gemini 3.1 Pro は高度な推論・マルチモーダル対応AIとして、 安全性・倫理性・リスク管理 を重視
現実世界の複雑な課題解決 や 多様な業務自動化 に強み
利用ガイドライン・リスク・緩和策 は随時更新され、 透明性の高い運用 を目指す

Hackerたちの意見

価格はGemini 3 Proと変わらず、入力が$2/M、出力が$12/Mだよ。知識のカットオフは2025年1月で変わってない。Gemini 3.1 Proは「中程度」の思考をサポートしてるけど、Gemini 3ではできなかったんだ。Opus 4.6の入力が$5/M、出力が$25/Mと比べると、もしGemini 3.1 Proが同じくらいのパフォーマンスを持っているなら、価格差は結構目立つね。

└

アップデートは主にシステムプロンプトとコアモデル周りのオーケストレーションやツールの変更が中心みたいだね。知識のカットオフが変わらないなら。

└

Vendor-Bench 2で長期的な視点での大きな進展が見られないなら、CCから乗り換えるつもりはないよ。Googleがその点でAnthropicに勝てるまで、Claude Codeとトップの長期モデルの組み合わせは、全層での最適化を進めていくと思う。

└

G3.1Pにはまだ最小限の推論がないね :( （これがOpus 4.6の値段に見合う理由だよ。思考をオフにすると3倍から5倍速くなるけど、知能はほんの少ししか失わない。誰もまだそれに気づいてないみたい。）

「ペリカンが自転車に乗っている」テスト以外のSVGではうまくいってるよ。このプロンプトみたいにね：「ユニコーンがXboxで遊んでいるSVGを作成して」まだ最終結果にはちょっと調整が必要だけど、ARC-AGIベンチマークがこんなに跳ね上がってるから、モデルの視覚能力がこれだけうまくいってるんだと思う。

└

あのスタイルは、私がもらったペリカンと比べてちょっと3Dっぽくなってるのが面白いね。

└

モデルがSVGを生成するのがどんどん上手くなっていくと、リアルタイムで生SVGを使って任意のUIやインタラクティブメディアを作れるようになる時が来るかもしれないな（フラッシュゲームみたいに）。

└

一方で、他のベクター画像フォーマットの生成（例えば、「セイウチが歯を磨いているポストスクリプトファイルを作成」）は、あまり改善されていないみたい。もしかしたら、SVG生成に特化して最適化しているのかもね。

タイトルが間違ってるよ、「Gemini 3.1 Pro」にすべきだね。すごくいいペリカンだね： - でも5分以上かかったけど、これは発売日でパフォーマンスの問題があるからだと思う。

└

あれは何？バスケットの中のおやつ？

└

Geminiファミリーのモデルに対する私の主な問題を見事に示してるね。彼らはいつも「期待以上」のことをしようとする。私が明示的にそれに反対するプロンプトを出してもね。この場合、ほとんどのSVGは自転車とペリカンだけでなく、雲や太陽、ペリカンの帽子なども含まれてる。コーディングしても全く同じことが起こる。Geminiに「助けになる」リファクタリングをしないようにするのはほぼ不可能で、何を言ってもコードコメントを追加し続ける。全体的に非常にイライラする体験だよ。

└

もっと詳しいプロンプトの使用をやめたの？ここで説明してたと思うけど。https://simonwillison.net/2025/Nov/18/gemini-3/

Hacker Newsで議論の続きを見る

ハクソク