Googleの動画生成AI「Veo 3」とは?進化した機能と使い方を解説

目次

概要

2025年5月、Google DeepMindは最新の動画生成AI「Veo 3」を発表しました。テキストや画像からリアルな映像を生成するこのモデルは、音声や効果音の自動生成にも対応し、映像制作の新たな可能性を示しています。本記事では、Veo 3の特徴や利用方法、料金体系、安全性について詳しく解説します。

Veo3の主な特徴と機能

・テキスト・画像からの動画生成
Veo 3は、テキストや画像を入力として、最大8秒の高品質な動画を生成します。映像には、自然な動きやリアルな物理挙動が再現されます。

・音声・効果音の自動生成
映像に合わせて、登場人物のセリフや環境音、効果音などを自動で生成します。これにより、映像と音声がシームレスに統合されたコンテンツが作成可能です。

・高度なカメラワークとスタイル制御
カメラのアングルや動き、レンズの種類などを細かく指定でき、映画のようなシネマティックな映像表現が可能です。

・Flowとの連携
Googleの映像制作ツール「Flow」と連携し、複数のシーンやキャラクターを組み合わせた複雑な映像制作にも対応しています。

・安全性
Veo 3は、生成された映像にDeepMindの透かし技術「SynthID」を埋め込むことで、AI生成コンテンツであることを識別可能にしています。また、暴力的・性的な内容や著作権侵害を防ぐためのフィルタリングも実装されています。

Veo3の提供形態・料金

Veo 3の利用には、Google AI ProまたはGoogle AI Ultraのサブスクリプションプランが必要です。
各プランで利用できる機能・サービスを表にまとめます。

プラン名月額(税込)主な特徴と利用可能サービス
Google AI Pro¥2,900(初月無料)・GeminiアプリでVeo 3の限定アクセス
・Flow(映画編集AI)の利用
・WhiskでVeo 2の動画生成上限UP
・2.5 ProによるDeep Research
・Gmail/Docs/Chrome/Driveとの連携
・NotebookLM(AIノート)利用拡大
・2TBのクラウドストレージ
Google AI Ultra¥36,400(初回3か月¥18,000)・Proの全機能+Veo 3の最高限度利用
・Flowの高度な映画制作機能
・2.5 Pro Deep Think(高精度推論)
・Project Mariner(AIエージェント)
・YouTube Premium個人プラン付与
・NotebookLMの全機能(予定)
・30TBストレージ
  • Geminiアプリ:テキストや画像からプロンプト生成。Veo 3はUltraで最高限度利用が可能。
  • Flow:シーンやキャラクターを組み合わせて本格的な動画編集ができる新AIツール。
  • Whisk:画像→動画変換(Veo 2)で高い上限。
  • NotebookLM:AIによるリサーチ/原稿作成支援。Ultraで更に多機能。
  • Google Workspace連携:GmailやDocs上でGemini/AI機能を活用可能。
  • YouTube Premium:Ultraプランで付帯。
  • Project Mariner:AIエージェント型リサーチ支援の試験運用がUltra限定で提供。

Veo3の利用方法

今回はGeminiからVeo 3を利用します。
※利用にはGoogle AI ProまたはGoogle AI Ultraのプランへの加入が必要です。

1.Geminiアプリにアクセスし、Veo 3のアイコンを選択。


2.プロンプト入力で動画の生成ができます。

今回はOpenAIの動画生成AI「Sora」の記事と同じプロンプトを利用します。

プロンプト:
午後の柔らかな日差しが差し込むリビングルームで、ふわふわの長毛猫がソファの上で丸くなって寝ているシーンをリアリスティックな映像で再現してください。時間経過とともにネコはゆっくりと伸びをし、カーテン越しの風に揺れる室内植物や薄く響く遠くの街の音が、穏やかな日常を感じさせます。自然なカメラワークと音響で、日常生活の一コマを丁寧に切り取ったような臨場感ある映像にしてください。

生成された動画は以下になります。

※音声が鳴ります、ご注意ください。

出力結果:

動画の精度高さはもちろん、音声までついているのは驚きですね。

次に動画生成AIは難しい、魚を捌く動画を生成してみました。

プロンプト:
真上の固定カメラ。板前が手袋を着け、木のまな板上のアジを三枚おろしにするワンカット。動作は①ウロコを素早く払う → ②頭を落とす → ③背骨に沿って右身を外す → ④裏返して左身を外す。明るい自然光、包丁とまな板のリアルな効果音のみ。テロップ・BGMなし。ラスト1秒で右身・中骨・左身を横一列に整えた静止フレームで終わる。

出力結果:

さすがに切るところが変だったりしますが大分良い線はいってますね。
効果音が結構クオリティ高いですね。

おわりに

音声機能やプロンプトへの追従性の向上によって、Veo 3は従来の動画生成AIを大きく超える表現力を実現しています。
AIが自動でセリフや効果音まで組み込んだ映像を短時間で生成できるため、個人クリエイターはもちろん、広告や映像制作の現場でも実用性が高まっています。
今後は、さらなる解像度や編集自由度の向上、新たな連携サービスの追加など、Veo 3を取り巻くエコシステムの進化にも期待したいところです。
映像生成AIの新たなスタンダードとなるか、引き続き動向を注視していきたいと思います。

併せてお読みください

あわせて読みたい
OpenAIが提供する「Sora」とは?最新画像・動画生成AIを徹底解説 Soraとは? Soraは、OpenAIが提供する画像・動画生成が可能なクリエイティブAIツールです。高品質な画像生成AI「4o Image Generation」のほか、テキストや画像を入力す...
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

目次