Googleは2024年12月16日、新たな動画生成モデル「Veo 2」と最新の画像生成モデル「Imagen 3」を発表しました。さらに、画像生成における新たな実験ツール「Whisk」も導入され、これらのモデルが持つクリエイティブな可能性をさらに拡張しています。
Veo 2:高品質かつリアルな動画生成
Veo 2は、物理法則や人間の動き、表情のニュアンスをより精細に理解し、リアリティとディテールに優れた動画を生成します。最大4K解像度、数分間の動画にも対応し、シネマティックな効果やカメラアングルの指定にも応じることができます。
例えば「18mmレンズ」と指定すれば広角ショットを再現し、「浅い被写界深度」と入力すれば背景をぼかし被写体にフォーカスを当てた映像を生成します。人間の審査員による比較評価でも、Veo 2は他の先進モデルを上回る結果を達成しました。
Veo 2の出力映像には、SynthIDによる透かしが埋め込まれ、AI生成コンテンツであることを識別可能にしています。また、安全性と品質向上のため、VideoFX、YouTube Shorts、Vertex AIを通じて段階的に公開される予定です。
Imagen 3:鮮明なディテールと多様なスタイル表現
Imagen 3は、光や構図の改善に加え、フォトリアリズムから抽象画、アニメまで多様なアートスタイルを忠実に再現できるよう進化しました。人間の審査による比較でも、Imagen 3は他の主要な画像生成モデルを上回る結果を示し、高精細なディテールと質感を持つ画像を提供します。
本日より、Imagen 3はGoogle Labsの画像生成ツール「ImageFX」を通じて、世界100カ国以上で利用可能となります。
Whisk:画像を入力しアイデアを視覚化する新ツール
Whiskは、入力した画像をもとに、シーンやスタイル、被写体を自由に組み合わせてリミックスできる実験的ツールです。Imagen 3とGeminiの視覚理解能力を統合し、画像の内容を自動でキャプション化し、それを生成のプロンプトに活用します。
これにより、デジタルプラッシュやステッカー、エナメルピンなど、自分だけのクリエイティブなコンテンツを手軽に作成できるようになります。
今回紹介したVeo 2やImagen 3で生成されたコンテンツは引用元のURLから確認できます。
引用