Gemini 3 Pro Image(Nano Banana Pro)を使ってみた

目次

概要

Gemini 3 Pro Imageは、Google DeepMindが2025年11月に発表した最新のネイティブ画像生成・編集モデルです。
公式には「Gemini 3 Pro Image」と呼ばれますが、プロダクト名としては Nano Banana Pro が前面に出ており、「Gemini 2.5 Flash Image(Nano Banana)」の後継となる位置づけです。

Gemini 3 Pro Image(Nano Banana Pro)は、テキストと画像をまとめて扱えるマルチモーダルモデルで、Gemini 3 Proの高度な推論能力と世界知識をそのまま画像生成・編集に持ち込んだ形になっています。

外部ベンチマークのLMArena「Image Edit Arena」では、gemini-3-pro-image-preview (nano-banana-pro) がELO 1371で1位にランクインしており、従来1位だった gemini-2.5-flash-image-preview (nano-banana) を上回るスコアを記録しています。
※2025年11月時点、LMArenaの情報

Gemini 3 Pro Image(Nano Banana Pro)の主な特徴と機能

Gemini 3 Pro Image(Nano Banana Pro)の主な特徴は次の通りです。

  • 高度な推論 × 画像生成・編集
    • 基盤モデルである Gemini 3 Pro の推論能力を活かし、複雑な編集指示や条件付き生成に強い
    • 画像の内容を理解したうえで、「雰囲気はそのまま、時間帯だけ夕方に」「プレゼン資料として読める構図で」など、文脈依存の指示に対応
  • テキストレンダリングの大幅強化
    • 2K〜4K解像度で、英語だけでなく多言語のテキストをポスターやUIモックレベルで読みやすく描画できるように設計
    • インフォグラフィックやメニュー表、チラシなど「文字が主役」の画像生成が得意分野として強調されています。
  • マルチイメージ&マルチキャラクター
    • 最大14枚程度までの画像を1枚にブレンドし、最大5人までの人物の外観を保ったまま構図を組み直す、といった高度な合成が可能。
  • 高解像度(最大4K)での生成・編集
    • 1K/2Kの標準解像度に加え、4K(~4096x4096px)出力にも対応し、広告や印刷用途も視野に入れた品質を目指しています。
  • C2PAメタデータやSynthIDによる透かし
    • 生成画像にC2PA互換メタデータや透かしを埋め込むことで、「AI生成コンテンツであること」を後から確認しやすくしている点も公式にアピールされています。

Gemini 3 Pro Image(Nano Banana Pro)の提供形態・料金

料金プラン一覧

※金額・条件はすべて2025年11月時点の公式情報・公表資料をもとにした整理です。
実際の料金は必ず公式サイトでご確認ください。

提供形態利用環境(チャネル)料金詳細(画像生成・編集)
一般ユーザー(無料枠)Geminiアプリ / Geminiウェブ / Google AI StudioNano Banana Proを「画像を作成」等の画面から無料で試用可能。
利用回数や解像度に上限があり、上限を超えると自動的に通常のNano Banana(Gemini 2.5 Flash Image)にフォールバックする仕様とされています。
一般ユーザー(有料サブスク)Google AI Pro / Google One AIプレミアム日本向けのGoogle AI Pro(旧Google One AI Premium)は月額2,900円で、Gemini 3 ProやNano Banana Proなど高性能モデルと2TBストレージを含むプラン。
Nano Banana Proの利用上限が無料版より大幅に緩和されます。
開発者向けAPI / Vertex AIGemini API / Google AI Studio / Vertex AIgemini-3-pro-image-preview の標準プランでは、テキスト・画像入力が$2/100万トークン(画像入力1枚あたり約$0.0011)、画像出力は1K/2K画像の1枚あたり約$0.134、4K画像で約$0.24。
バッチAPI利用時は画像出力が約半額になる価格設定です(プレビュー料金)。
Gemini Developer API の料金  |  Gemini API  |  Google AI for Developers

内容は随時更新されるため、最新情報は公式サイトをご確認ください。

Gemini 3 Pro Image(Nano Banana Pro)の利用方法

利用開始手順

Google AI Studioで使う場合

  1. ブラウザで Google AI Studio(aistudio.google.com) にアクセスし、Googleアカウントでログイン
  2. 「Image」系のモデル一覧から 「Gemini 3 Pro Image(Nano Banana Pro)」またはモデルID gemini-3-pro-image-preview を選択
  3. 入出力を「Text+Image」に設定し、画像生成・編集のプロジェクトを開始

※UIのラベル名は今後変更される可能性がありますが、モデルIDで探すのが確実です(公式ドキュメントでも gemini-3-pro-image-preview と明記)。

Geminiアプリで使う場合

  1. スマホまたはWeb版の Geminiアプリ を開く
  2. 「画像を作成」「Create image」などのメニューを選択
  3. モデル選択で「Nano Banana Pro」あるいは「Thinkingモデルの画像生成」を選ぶと、裏側でGemini 3 Pro Image(Nano Banana Pro)が利用されます(地域・プランにより表示が異なる場合あり)。

画像生成

今回は比較できるように、Gemini 2.5 Flash Image(Nano Banana)の記事でも使っていたプロンプトを使ってみます。

キャラクター一貫性テスト

キャラクター一貫性テストを、Gemini 3 Pro Image(Nano Banana Pro)でも実行してみました。

プロンプト(日本語)

同じ女性ビジネスパーソンを4つの異なるシーンで描いてください:

  1. モダンなオフィスでプレゼンテーションをしている
  2. カフェでノートパソコンで作業している
  3. ジムでワークアウトウェアを着て運動している
  4. 夜のパーティーでエレガントなドレスを着ている
    すべてのシーンで顔の特徴、年齢、特徴的な部分を完全に一致させてください。

出力結果:

一つのプロンプトで4コマ的な構成の画像を生成させたところ、4シーンともかなり高いレベルで同一人物らしさが維持されました。
Nano Banana(2.5世代)でも十分優秀でしたが、Nano Banana Proでは髪型の乱れ方や表情の微妙なニュアンスまで揃っており、「同じ人が1日を過ごしている写真セット」のような統一感が出やすくなった印象です

テキストレンダリング+複雑な指示

次に、英語/日本語のテキスト入りメニュー看板でレンダリング精度を試してみました。

プロンプト(English)

Create a vintage 1950s diner menu board with the following text clearly readable:

  • “Today’s Special: $4.99”
  • “Nano Banana Pro Sundae”
  • “Fresh Coffee 25¢”
    Include realistic wear, chalk texture, and period-appropriate typography. Place it in a photorealistic retro diner setting with red leather booths visible in the background.

プロンプト(日本語)

1950年代のビンテージなダイナーのメニューボードを作成してください。以下のテキストがはっきり読めるように:

  • 「本日のスペシャル: ¥780」
  • 「ナノバナナプロサンデー」
  • 「挽きたてコーヒー ¥120」
    リアルな使用感、チョークの質感、時代に合ったタイポグラフィを含めてください。背景には赤い革張りのブースが見えるレトロなダイナーの店内を配置してください。

出力結果:

出力結果:

英語版は、価格表記や単語の綴りまでほぼ完璧に再現されました。
従来うまく対応できなかった日本語も、Gemini 2.5 Flash Image(Nano Banana)のときより明らかに文字つぶれが減り、漢字・カタカナとも判読できるようになりました。

今回のアップデートでインフォグラフィックやスライド用のダミー画像では、Nano Banana Proのテキストレンダリングは実務レベルで十分実用だと感じました。

画像の編集

最後に、既存写真を編集するケースを試しました。

編集用プロンプト

この画像からすべての人物を削除して、代わりに前景にゴールデンレトリバーを座らせてカメラを見ているようにしてください。
天候を霧がかった朝に変更し、柔らかな朝日が差し込むようにしてください。
建築物の詳細はすべてそのまま維持してください。

建物の線や装飾、看板などのディテールをほぼ崩さずに、人物だけを自然に消去してくれました。
手前に追加したゴールデンレトリバーは、影の向きや光の当たり方が背景とよく馴染んでおり、「合成感」がかなり薄いです。
追加で「もう少し霧を濃くして」「犬を少し左に寄せて」などと追い指示をしても、編集履歴を保ちながら局所的に修正されるため、Photoshopでレイヤーを調整しているような感覚で対話編集が進められました。

このレベルの編集が、マスク指定やレイヤー操作なしに自然言語だけで完結するのは、Nano Banana Pro(Gemini 3 Pro Image)の大きな価値だと感じます。

おわりに

Gemini 3 Pro Image(Nano Banana Pro)をひととおり試してみて、「Nano Banana(Gemini 2.5 Flash Image)の成功体験を、さらにプロ用途に押し広げたモデル」という印象を持ちました。

  • キャラクター一貫性
  • 多言語テキストの描画
  • 高解像度編集とマルチイメージ合成

といったポイントが強化されたことで、マーケティング素材、プレゼン資料、Webデザイン、UIモックなど、「ビジネス現場でそのまま使える画像生成ツール」としての実用性が大きく向上しています。

一方で、API料金や処理時間はNano Bananaより重く、すべてのユースケースでNano Banana Proを使うのはコスト過多になりがちです。
ラフ案や大量バリエーション生成はNano Banana、本番クオリティや重要案件にはNano Banana Pro(Gemini 3 Pro Image)という棲み分けが、これからの現実的なワークフローになっていくのではないでしょうか。

併せてお読みください

あわせて読みたい
Gemini 2.5 Flash Image(nano-banana)を実際に使ってみた 概要 Gemini 2.5 Flash Imageは、Google DeepMindが2025年8月27日に開発者向け“プレビュー提供を開始した、最先端のAI画像生成・編集モデルです。内部コードネーム「Nan...
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

目次