- Gemini 3.5 Flashは競合フロンティアモデルと比べ出力トークン速度が4倍高速で、低遅延と高品質を同時に実現した
- Terminal-Bench 2.1で76.2%、MCP Atlas 83.6%など複数のエージェント評価ベンチマークで最高水準を達成
- Google Antigravityと組み合わせた並列サブエージェント実行で、従来数日かかった開発タスクを数時間に短縮
Google I/O 2026で発表された新モデル
Googleは2026年5月19日、「Gemini 3.5 Flash」を一般公開した。Google I/O 2026の目玉として位置づけられた同モデルは、「フロンティア級の知能と即時対応能力の融合」を設計目標に掲げており、特にエージェント処理とコーディングタスクでの実用性向上を重視して開発されている。
Gemini app、Google SearchのAI Mode、Gemini API、そしてGoogleの新しいエージェント実行環境「Google Antigravity」の各プラットフォームで利用可能になっており、開発者から一般ユーザーまで幅広い用途に向けて即日提供が始まっている。
競合比4倍の出力速度を実現
Gemini 3.5 Flashの最大の特徴は出力速度にある。他のフロンティアモデルと比べて出力トークン速度が4倍高速とされており、Artificial Analysis Intelligence Indexの速度・品質マトリックスでは最高ランクの「右上」ポジションに位置する。
これは単なるスループット向上にとどまらない。エージェントが長いタスクを連続実行する際、各ステップの待機時間が積み重なって全体の処理時間を大きく左右する。出力速度の向上は、エージェントワークフロー全体のレイテンシ削減に直結する点で実用上の意味が大きい。
エージェント系ベンチマークの結果
エージェント関連の主要ベンチマークでは次の結果を記録している。
- Terminal-Bench 2.1: 76.2%(コーディングエージェントの評価)
- MCP Atlas: 83.6%(Model Context Protocol対応エージェントの評価)
- GDPval-AA: 1656 Elo(汎用エージェント評価)
- CharXiv Reasoning: 84.2%(マルチモーダル理解の評価)
エージェント評価の標準化が進む中、Gemini 3.5 Flashはエージェント操作・ツール連携・複雑な推論の各領域で一貫して高い水準を示しており、開発者にとって現実的な選択肢になりつつある。
並列サブエージェントで処理時間を短縮
Gemini 3.5 FlashはGoogle Antigravity環境と組み合わせることで、複数のサブエージェントを並列実行できる。従来のシングルエージェントがタスクを順番に処理していたのに対し、関連するサブタスクを同時並行で走らせる設計になっている。

Googleによれば、この仕組みにより、開発者が従来数日を要していた作業や、監査人が数週間かかっていた業務を大幅に短縮できるとしている。複雑なマルチステップワークフローを信頼性高く実行できる点が、エンタープライズ用途での採用を後押しする要因となりそうだ。
提供状況と今後の展開
Gemini 3.5 FlashはすでにShopifyやSalesforceへの展開が始まっており、ビジネス向けの活用事例が早期から積み上がっている。個人向けAIエージェント「Gemini Spark」のロールアウトも開始されており、エンドユーザーへの普及も並行して進む。
Googleは既存のGemini APIを利用しているアプリケーションが設定変更だけで移行できる設計を採用しており、開発者の移行障壁を下げている。速度・品質・エージェント性能の3点を同時に改善した今回のモデルは、企業の実業務における生成AI活用の選択肢として、より現実的な位置づけを獲得しつつある。
