今回の記事ではGoogleBardが画像生成AIモデル「Imagen2」に対応をしたので使ってみました。
ChatGPTで画像生成した記事もありますので、併せてご覧頂ければ。

Imagen2とは?
Imagen2はGoogle DeepMindによって開発された高度なAI画像生成技術です。
特徴として複雑なテキストプロンプトから高解像度で現実的な画像を生成する能力を持っています。
またImagen2は、エンブレム、レターマーク、抽象デザインなど、創造的で現実的なロゴを生成する能力を備えており、これらのロゴを製品、衣服、名刺などの異なる表面にオーバーレイすることができます。
GoogleBardでのImagen2の使い方
GoogleBardでの画像生成の方法を解説していきます、また注意点として
方法は簡単、画像を作成したいことと画像のイメージを伝えるだけです。
そうすることでイメージに沿った画像が生成されます。
今回はオレンジの画像を作成してもらいました。

気に入った画像がなければ「さらに生成」をクリックすると新しい画像が追加で生成されます。

Imagen2を色々試してみた
では実際に色々試してみます。
今回は比較してもらえるように英語ですが、ChatGPTのDALL·E 3と同じプロンプトを使用します。
ロゴ生成
青い鳥をモチーフにしたロゴ

特定のテーマに基づくイメージ生成
ファンタジー世界風のお城の画像

特定のシチュエーションに対応したイメージの生成
猫が魚をくわえている画像

icon生成
人のicon

特定の文字を入れた画像
「Open」という文字が入った画像

かなり高品質な画像を生成してくれました。
ただしChatGPTのように画像に対して追加のプロンプトを入力して修正してもらうことはできませんでした。
あとがき
全体的にフォトリアルな画像が生成される傾向がありました。
GoogleBardのImagen2は、特にリアリティが求められるシナリオで優れた性能を発揮しそうです。
また現在は英語でのプロンプトの入力のみですが、今後の日本語対応にも期待したいところです。