日本初*の日本語動画生成AI基盤モデル「AIdeaLab VideoJP」を商用利用可能で無償公開

日本語と英語の文章が直接入力可能な動画生成AI基盤モデルをフルスクラッチで開発。

日本語動画生成AI基盤モデル「AIdeaLab VideoJP」の生成例

最先端のAI技術を活用したソリューションを提供する株式会社AIdeaLab(本社:東京都千代田区、代表者:冨平準喜)は、日本語と英語の文章が直接入力可能な動画生成AI基盤モデル「AIdeaLab VideoJP」をフルスクラッチで開発し、日本初*の商用利用可能な日本語動画生成AI基盤モデルとして無償公開したことをお知らせいたします。

安全で透明性の高い日本語動画生成AI、AIdeaLab VideoJP (エーアイディアラボ ビデオ・ジェイピー) を商用利用可能で無償公開します。AIdeaLab VideoJPは学習に対する透明性が高く、著作権やライセンスに配慮して「フルスクラッチで」(0から)動画を学習しています。
AIdeaLab VideoJPは以下のURLにて無料で利用することができます。
https://huggingface.co/spaces/aidealab/AIdeaLab-VideoJP

AIdeaLab VideoJPは以下のURLから無料でダウンロードできます。
https://huggingface.co/aidealab/AIdeaLab-VideoJP

なお、AIdeaLab VideoJPは、経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が実施する、国内の生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」の成果をもとに作成されました。


AIdeaLab VideoJPの特徴

日本語と英語の文章がそのまま通じるモデル

動画生成を使ってみたいが使えないクリエイターの中には、プロンプトが英語であるから、使い勝手がわるいと思っている方も少なくないと思います。実際、動画生成AIに慣れている人も時には翻訳ソフトを使って入力している方もいるようです。しかし、翻訳ソフトを間に挟むことでニュアンスが変わるという問題が指摘されています。
そこで、AIdeaLab VideoJPでは、日本語を日本人の話す感覚と近いかたちで処理し、動画を生成できるようにしました。具体的には入力テキストを処理する技術を大規模言語モデル (LLM) であるllm-jp-3-1.8bにしました。これにより、例えば、「チューリップや菜の花、色とりどりの花が果てしなく続く畑を埋め尽くし、まるでパッチワークのようにカラフルに彩る。朝の柔らかな光が花びらを透かし、淡いグラデーションが映える。風に揺れる花々をスローモーションで捉え、花びらが優雅に舞う姿を映画のような演出で撮影。背景には遠くに連なる山並みや青い空、浮かぶ白い雲が立体感を引き立てる。」様子を生成したいとき、この文章をそのまま入力して生成された動画が次のとおりです。

「チューリップや菜の花、(中略、本文参照)」というプロンプトでAIdeaLab VideoJPから生成した動画

なお、日本語だけではなく、英語も通じます。むしろ、英語のほうが通じるので、時には英語も使ってあげてください。

学習に対して許諾が得られている動画を原則使用

ここでは機械学習する際に著作物の改変が発生しうると仮定します**。著作権者にとって勝手に改変されるのはあまりうれしいと思わないでしょう。また、勝手に改変されたものを販売されることもあまりうれしくないでしょう。そこで、本モデルでは、次の条件を満たす動画のみを機械学習に使用しました。

  • 動画は改変が許されるライセンスである
  • 動画は改変しても商用利用可能である
  • 動画はライセンスを変更しても良い

この3つの条件を満たすライセンスの動画は、主にCC-BY-4.0、CC-0になります。したがって、学習用動画は原則これらのライセンスに従う動画を用いました。具体的には次の学習用データセットに含まれる動画のみを使用しました。

https://huggingface.co/datasets/LanguageBind/Open-Sora-Plan-v1.0.0
https://huggingface.co/datasets/HuggingFaceFV/finevideo

なお、前者に関してはPixabayの動画のみを使っています。これらのデータセットに含まれる動画のみを使っているため、学習動画に対する透明性は限りなく高いと考えております。もし問題のある動画が見つけたら、ご報告いただけると今後の開発に助かります。

モデルのライセンスは定番のApache-2.0

動画生成を使ってみたいが使えないクリエイターの中には、ライセンスがややこしくて困るからという人が結構いると思います。そこでAIdeaLab VideoJPではシンプルさを大切にするために、オープンソースソフトウェア界隈でよく使われるApache License 2.0を採用しました。Apache License 2.0 はとてもわかりやすい有名なライセンスです。

ところでApache-2.0は表現に関する条項は一切ありません。我々のチームでは表現の自由を最大に尊重します。一方で、偽情報や誤情報に使うことは犯罪につながるため、我々は一切推奨しません。法律にしたがって使ってください。

最先端の技術を利用し、ご家庭でも動く推論速度の早さを実現

AIdeaLab VideoJPでは、Rectified Flow Transformerという推論速度の早い最先端アルゴリズムであるフローマッチングを使用しています。フローマッチングは動画生成AI、メタ社のMeta Movie Gen、テンセント社のHunyuanVideoなどで利用されています。フローマッチングの中でもRectified Flow Transformerの良いところは規模によってはご家庭のGPUでも動くことです。AIdeaLab VideoJPでは最小14GBのVRAMを持つGPUで動きます。

まとめ

AIdeaLab VideoJPは、クリエイターとAIの共存を考えた、商用利用できる透明性の高い日本語動画生成AIです。今後はAIdeaLab VideoJPよりも高品質な動画生成モデルの開発に取り組んでいきます。また、アニメ用の動画生成モデルも開発していきます。

AIdeaLab VideoJPについて、本リリースより詳しく知りたい方は次のブログをご覧ください。
https://note.com/aidealab/n/n677018ea1953

今後も皆様からのフィードバックを活かしながら、より良いサービス提供を目指します。質問や懸念があれば、どうぞ以下連絡先にお知らせください。
https://aidealab.com/contact

AIdeaLab株式会社では、動画生成AIをはじめとするAI開発に関するご相談を承っております。どうぞお気軽にお問い合わせください。
https://aidealab.com

注釈

*: 国内企業で動画生成AIの基盤モデルのフルスクラッチ開発としては日本初。2025/01/15時点、自社調べ。

**: 著作権法において、機械学習を含む情報解析に伴う改変は第30条の4により「いずれの方法によるかを問わず、利用すること」に該当するため、法的には問題ありません。

引用

プレスリリース・ニュースリリース...
日本初*の日本語動画生成AI基盤モデル「AIdeaLab VideoJP」を商用利用可能で無償公開 株式会社AIdeaLabのプレスリリース(2025年1月15日 13時03分)日本初*の日本語動画生成AI基盤モデル「AIdeaLab VideoJP」を商用利用可能で無償公開
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。