- Gemini 3.1 ProがARC-AGI-2で77.1%を記録し、前世代Gemini 3 Pro比で2倍以上の推論性能向上を達成。第三者評価でClaude 4.6 OpusとGPT-5.2を複数ベンチマークで上回る
- GPQA Diamond 94.3%、SWE-Bench Verified 80.6%、MMMLU 92.6%と科学・コーディング・マルチモーダル領域でも高スコアを記録
- API料金はGemini 3 Proから据え置き(入力$2.00/1Mトークン)で、Gemini APIおよびVertex AI経由で即日利用可能
単純な回答では不十分なタスクを主要ターゲットに
Googleは2026年2月19日、フラッグシップAIモデルの最新版「Gemini 3.1 Pro」を発表した。同モデルは「単純な回答では不十分なタスク」を主要ターゲットに設計されており、科学研究・工学・複雑な計画立案など、深い思考と合成を要するワークフロー向けに位置づけられている。
第三者評価機関Artificial Analysisによる独立評価では、Gemini 3.1 ProはClaude 4.6 OpusおよびGPT-5.2を複数のベンチマークで上回り、総合性能で首位に立ったとされる。Googleは昨年末にGemini 3 Proを発表してAIモデルの性能競争で首位に立ったが、その後OpenAIとAnthropicの新モデルに追い越された経緯があり、今回のリリースはその奪還を狙うものとなっている。
ARC-AGI-2で77.1%を記録 — 各専門ベンチマークでも前世代を上回る
ARC-AGI-2では77.1%のスコアを記録した。ARC-AGI-2は訓練データに含まれない未知の論理パターンを解かせる設計のベンチマークであり、この数値は前世代Gemini 3 Proの2倍超に相当する。

その他の主要ベンチマーク結果は以下の通りだ。
- 科学知識(GPQA Diamond):94.3%
- コーディング(LiveCodeBench Pro):Elo 2887
- コード修正(SWE-Bench Verified):80.6%
- マルチモーダル理解(MMMLU):92.6%
Googleはこれらの向上を「思考トークンと長期タスク処理の洗練」と表現しており、自律エージェントを構築する開発者にとってより信頼性の高い基盤を提供するとしている。
SVG自動生成から宇宙ステーション軌道追跡まで — 複雑なシステム合成の実例
GoogleはGemini 3.1 Proの実用面を示すため、複数のデモを公開した。テキストプロンプトからアニメーションSVGを生成する機能では、コードベースで出力されるためファイルサイズが小さく、従来の動画と比べてWebサイトやプレゼンテーションへの組み込みが容易だとされる。
その他の代表的なデモとして、公開テレメトリーストリームを設定して国際宇宙ステーションの軌道を可視化するライブダッシュボードの構築、ハンドトラッキングで操作できる3Dの鳥の群れシミュレーション(生成オーディオスコア付き)、エミリー・ブロンテの小説『嵐が丘』の雰囲気をWebデザインに変換するというものが挙げられた。いずれも単純なテキスト生成にとどまらず、意図や文脈を推論した上でシステムを構成する能力を示している。なお、Geminiシリーズではテキスト・画像から音楽を生成できる「Lyria 3」も搭載されており、マルチメディア生成における機能拡張が続いている。
エンタープライズ各社が実導入を報告 — JetBrainsで品質15%向上を確認
プレビュー版を先行統合した企業からは、具体的な評価が集まっている。JetBrainsのAIディレクター、ウラジスラフ・タンコフ氏は前バージョン比で15%の品質向上を確認したと述べ、「より強力で高速、かつ効率的で出力トークン数が少なくて済む」とコメントした。
DatabricksのCTOハンリン・タン氏は、表データと非構造化データにまたがる推論ベンチマーク「OfficeQA」で最高クラスの結果を得たと報告した。3Dアニメーション向けツールを開発するCartwheelの共同創業者アンドリュー・カー氏は、「3D変換の理解が大幅に向上し、アニメーションパイプラインで長年存在していた回転順序のバグが解消された」と述べている。
API料金は前世代と同水準 — Gemini APIとVertex AIで即日提供
API料金はGemini 3 Proから変更がなく、入力が100万トークンあたり2.00ドル(200,000トークン以下のプロンプト)、出力が12.00ドルとなっている。200,000トークンを超えるプロンプトでは入力4.00ドル、出力18.00ドルに引き上げられる。性能が大幅に向上した一方で料金が据え置かれたことで、API利用者にとっては実質的なコストパフォーマンス改善となった形だ。
Gemini APIおよびVertex AI経由で即日利用可能であり、コンシューマー向けにはGemini appおよびNotebookLMへの段階的なロールアウトが進められている。Google AI ProおよびUltraサブスクライバーはより高い利用枠でアクセスできる。現時点は「プレビュー」ステータスでの提供であり、一般提供(GA)に向けて安全性と性能の検証が続けられるとしている。
参考元 https://deepmind.google/blog/gemini-3-1-pro-a-smarter-model-for-your-most-complex-tasks/