概要
Gemini 3 Pro Imageは、Google DeepMindが2025年11月に発表した最新のネイティブ画像生成・編集モデルです。
公式には「Gemini 3 Pro Image」と呼ばれますが、プロダクト名としては Nano Banana Pro が前面に出ており、「Gemini 2.5 Flash Image(Nano Banana)」の後継となる位置づけです。
Gemini 3 Pro Image(Nano Banana Pro)は、テキストと画像をまとめて扱えるマルチモーダルモデルで、Gemini 3 Proの高度な推論能力と世界知識をそのまま画像生成・編集に持ち込んだ形になっています。
外部ベンチマークのLMArena「Image Edit Arena」では、gemini-3-pro-image-preview (nano-banana-pro) がELO 1371で1位にランクインしており、従来1位だった gemini-2.5-flash-image-preview (nano-banana) を上回るスコアを記録しています。
※2025年11月時点、LMArenaの情報
Gemini 3 Pro Image(Nano Banana Pro)の主な特徴と機能
Gemini 3 Pro Image(Nano Banana Pro)の主な特徴は次の通りです。
- 高度な推論 × 画像生成・編集
- 基盤モデルである Gemini 3 Pro の推論能力を活かし、複雑な編集指示や条件付き生成に強い
- 画像の内容を理解したうえで、「雰囲気はそのまま、時間帯だけ夕方に」「プレゼン資料として読める構図で」など、文脈依存の指示に対応
- テキストレンダリングの大幅強化
- 2K〜4K解像度で、英語だけでなく多言語のテキストをポスターやUIモックレベルで読みやすく描画できるように設計
- インフォグラフィックやメニュー表、チラシなど「文字が主役」の画像生成が得意分野として強調されています。
- マルチイメージ&マルチキャラクター
- 最大14枚程度までの画像を1枚にブレンドし、最大5人までの人物の外観を保ったまま構図を組み直す、といった高度な合成が可能。
- 高解像度(最大4K)での生成・編集
- 1K/2Kの標準解像度に加え、4K(~4096x4096px)出力にも対応し、広告や印刷用途も視野に入れた品質を目指しています。
- C2PAメタデータやSynthIDによる透かし
- 生成画像にC2PA互換メタデータや透かしを埋め込むことで、「AI生成コンテンツであること」を後から確認しやすくしている点も公式にアピールされています。
Gemini 3 Pro Image(Nano Banana Pro)の提供形態・料金
料金プラン一覧
※金額・条件はすべて2025年11月時点の公式情報・公表資料をもとにした整理です。
実際の料金は必ず公式サイトでご確認ください。
| 提供形態 | 利用環境(チャネル) | 料金詳細(画像生成・編集) |
|---|---|---|
| 一般ユーザー(無料枠) | Geminiアプリ / Geminiウェブ / Google AI Studio | Nano Banana Proを「画像を作成」等の画面から無料で試用可能。 利用回数や解像度に上限があり、上限を超えると自動的に通常のNano Banana(Gemini 2.5 Flash Image)にフォールバックする仕様とされています。 |
| 一般ユーザー(有料サブスク) | Google AI Pro / Google One AIプレミアム | 日本向けのGoogle AI Pro(旧Google One AI Premium)は月額2,900円で、Gemini 3 ProやNano Banana Proなど高性能モデルと2TBストレージを含むプラン。 Nano Banana Proの利用上限が無料版より大幅に緩和されます。 |
| 開発者向けAPI / Vertex AI | Gemini API / Google AI Studio / Vertex AI | gemini-3-pro-image-preview の標準プランでは、テキスト・画像入力が$2/100万トークン(画像入力1枚あたり約$0.0011)、画像出力は1K/2K画像の1枚あたり約$0.134、4K画像で約$0.24。バッチAPI利用時は画像出力が約半額になる価格設定です(プレビュー料金)。 Gemini Developer API の料金 | Gemini API | Google AI for Developers |
Gemini 3 Pro Image(Nano Banana Pro)の利用方法
利用開始手順
Google AI Studioで使う場合
- ブラウザで Google AI Studio(aistudio.google.com) にアクセスし、Googleアカウントでログイン
- 「Image」系のモデル一覧から 「Gemini 3 Pro Image(Nano Banana Pro)」またはモデルID
gemini-3-pro-image-previewを選択 - 入出力を「Text+Image」に設定し、画像生成・編集のプロジェクトを開始
※UIのラベル名は今後変更される可能性がありますが、モデルIDで探すのが確実です(公式ドキュメントでも gemini-3-pro-image-preview と明記)。
Geminiアプリで使う場合
- スマホまたはWeb版の Geminiアプリ を開く
- 「画像を作成」「Create image」などのメニューを選択
- モデル選択で「Nano Banana Pro」あるいは「Thinkingモデルの画像生成」を選ぶと、裏側でGemini 3 Pro Image(Nano Banana Pro)が利用されます(地域・プランにより表示が異なる場合あり)。
画像生成
今回は比較できるように、Gemini 2.5 Flash Image(Nano Banana)の記事でも使っていたプロンプトを使ってみます。
キャラクター一貫性テスト
キャラクター一貫性テストを、Gemini 3 Pro Image(Nano Banana Pro)でも実行してみました。
プロンプト(日本語)
同じ女性ビジネスパーソンを4つの異なるシーンで描いてください:
- モダンなオフィスでプレゼンテーションをしている
- カフェでノートパソコンで作業している
- ジムでワークアウトウェアを着て運動している
- 夜のパーティーでエレガントなドレスを着ている
すべてのシーンで顔の特徴、年齢、特徴的な部分を完全に一致させてください。
出力結果:

一つのプロンプトで4コマ的な構成の画像を生成させたところ、4シーンともかなり高いレベルで同一人物らしさが維持されました。
Nano Banana(2.5世代)でも十分優秀でしたが、Nano Banana Proでは髪型の乱れ方や表情の微妙なニュアンスまで揃っており、「同じ人が1日を過ごしている写真セット」のような統一感が出やすくなった印象です
テキストレンダリング+複雑な指示
次に、英語/日本語のテキスト入りメニュー看板でレンダリング精度を試してみました。
プロンプト(English)
Create a vintage 1950s diner menu board with the following text clearly readable:
- “Today’s Special: $4.99”
- “Nano Banana Pro Sundae”
- “Fresh Coffee 25¢”
Include realistic wear, chalk texture, and period-appropriate typography. Place it in a photorealistic retro diner setting with red leather booths visible in the background.
プロンプト(日本語)
1950年代のビンテージなダイナーのメニューボードを作成してください。以下のテキストがはっきり読めるように:
- 「本日のスペシャル: ¥780」
- 「ナノバナナプロサンデー」
- 「挽きたてコーヒー ¥120」
リアルな使用感、チョークの質感、時代に合ったタイポグラフィを含めてください。背景には赤い革張りのブースが見えるレトロなダイナーの店内を配置してください。
出力結果:

出力結果:

英語版は、価格表記や単語の綴りまでほぼ完璧に再現されました。
従来うまく対応できなかった日本語も、Gemini 2.5 Flash Image(Nano Banana)のときより明らかに文字つぶれが減り、漢字・カタカナとも判読できるようになりました。
今回のアップデートでインフォグラフィックやスライド用のダミー画像では、Nano Banana Proのテキストレンダリングは実務レベルで十分実用だと感じました。
画像の編集
最後に、既存写真を編集するケースを試しました。

編集用プロンプト
この画像からすべての人物を削除して、代わりに前景にゴールデンレトリバーを座らせてカメラを見ているようにしてください。
天候を霧がかった朝に変更し、柔らかな朝日が差し込むようにしてください。
建築物の詳細はすべてそのまま維持してください。

建物の線や装飾、看板などのディテールをほぼ崩さずに、人物だけを自然に消去してくれました。
手前に追加したゴールデンレトリバーは、影の向きや光の当たり方が背景とよく馴染んでおり、「合成感」がかなり薄いです。
追加で「もう少し霧を濃くして」「犬を少し左に寄せて」などと追い指示をしても、編集履歴を保ちながら局所的に修正されるため、Photoshopでレイヤーを調整しているような感覚で対話編集が進められました。
このレベルの編集が、マスク指定やレイヤー操作なしに自然言語だけで完結するのは、Nano Banana Pro(Gemini 3 Pro Image)の大きな価値だと感じます。
おわりに
Gemini 3 Pro Image(Nano Banana Pro)をひととおり試してみて、「Nano Banana(Gemini 2.5 Flash Image)の成功体験を、さらにプロ用途に押し広げたモデル」という印象を持ちました。
- キャラクター一貫性
- 多言語テキストの描画
- 高解像度編集とマルチイメージ合成
といったポイントが強化されたことで、マーケティング素材、プレゼン資料、Webデザイン、UIモックなど、「ビジネス現場でそのまま使える画像生成ツール」としての実用性が大きく向上しています。
一方で、API料金や処理時間はNano Bananaより重く、すべてのユースケースでNano Banana Proを使うのはコスト過多になりがちです。
ラフ案や大量バリエーション生成はNano Banana、本番クオリティや重要案件にはNano Banana Pro(Gemini 3 Pro Image)という棲み分けが、これからの現実的なワークフローになっていくのではないでしょうか。


