- Nano Banana 2 Liteは約4秒で画像を生成し、1000枚あたり0.034ドルという低価格でGoogle AI StudioおよびGemini APIから即日利用できる
- Gemini Omni Flashはテキスト・画像・動画を入力に受け付け、1秒0.10ドルで最長10秒の動画を生成するマルチモーダル動画生成モデル
- 両モデルを組み合わせることで、テキストプロンプトから画像生成・動画化までの一気通貫パイプラインを低コストで構築できる
2モデルを同時API公開
Googleはこのほど、画像生成モデル「Nano Banana 2 Lite」と動画生成モデル「Gemini Omni Flash」をGoogle AI StudioおよびGemini APIで開発者向けに公開しました。どちらも速度とコスト効率を大幅に改善したモデルで、マルチメディアコンテンツの自動生成をより手軽にする実用的なリリースです。
両モデルは単体でも利用できますが、Nano Banana 2 Liteで静止画を生成し、その出力をGemini Omni Flashに渡して動画化するワークフローとの親和性が高く、Googleは画像から動画への一気通貫パイプラインとしての活用を推奨しています。
Nano Banana 2 Liteの速度と価格
Nano Banana 2 LiteはGoogleが「最速・最もコスト効率の高い画像生成モデル」と位置づけるモデルです。テキストプロンプトから画像1枚を約4秒で生成し、価格は1000枚あたり0.034ドルという低水準に設定されています。
主な強みとして以下の3点が挙げられます。
- プロンプトへの高い追従性
- 複数枚にわたるキャラクター一貫性の維持
- 画像内テキストの読みやすさ
利用できるプラットフォームはGoogle AI StudioとGemini APIのほか、Gemini Enterprise Agent Platformにも対応しています。コンシューマー向けとしては、Google検索のAI Mode、Geminiアプリ、Google Photos、Google Adsへの順次展開が計画されている。
Gemini Omni Flashの動画生成
Gemini Omni Flashは、Geminiのマルチモーダル推論と動画生成・編集を組み合わせたモデルです。テキスト・画像・動画のいずれか、またはそれらの組み合わせを入力として受け付け、最長10秒の動画を1秒あたり0.10ドルで生成します。現時点ではパブリックプレビューとして提供されており、Google AI StudioとGemini APIから利用可能。Geminiアプリとクリエイター向けツール「Google Flow」にも搭載されています。
自然言語による動画編集の指示が可能なのも特徴の一つです。既存の動画を入力として渡しながら「背景を差し替えてほしい」「このシーンにテキストを追加して」といった対話的な編集が行えます。ただし現時点では3秒を超える動画の参照には未対応であるため、長尺素材の編集用途にはまだ制限があります。
ストリーミング型の動画編集アプローチとの比較として、3段階蒸留で12fps超のリアルタイム編集を実現するLiveEditも参照すると、Gemini Omni Flashとは異なるリアルタイム性の実現方法として理解が深まります。
価格と開発への影響
両モデルの価格を整理します。
- Nano Banana 2 Lite: 画像1000枚あたり0.034ドル
- Gemini Omni Flash: 動画1秒あたり0.10ドル(10秒動画1本で約1.0ドル)
画像生成については、他の主要APIと比較して単価が低い水準にあり、大量生成が前提のプロダクト開発での採用を後押しします。動画生成は10秒1本あたり1.0ドル前後の費用感であるため、プロトタイプ制作やA/Bテスト向け素材作成にも試しやすい価格設定です。
Gemini Enterprise Agent Platformとの連携により、既存のGeminiベースのエージェントシステムにビジュアル生成機能を後付けで追加できる点も、エンタープライズ開発者にとって注目されるポイントです。
