音楽とサウンド生成のための「Stable Audio」を発表

2023年9月13日

Stability AI は、音楽とサウンド生成のための初のAIモデルとなる Stable Audio を発表しました。

Stable Audio は、最新の生成 AI 技術を駆使し、使いやすい Web インターフェースを介して、より高速で高品質な音楽とサウンドエフェクトを提供する世界初の製品です。Stability AI は、45秒までのトラックを生成してダウンロードできる Stable Audio の基本無料版と、商用プロジェクト用にダウンロード可能な90秒のトラックを提供する「Pro」サブスクリプションを提供しています。

StabilityAI の CEO である Emad Mostaque は、「唯一の独立した、オープンでマルチモーダルな生成 AI の会社として、音楽クリエイターをサポートする製品を開発するために私たちの専門知識を活用できることを嬉しく思います。私たちの願いは、Stable Audio が音楽愛好家やクリエイティブな専門家に AI の助けを借りて新しいコンテンツを生み出す力を与えることであり、それが無限のイノベーションを生み出すことを期待しています。」と述べています。

Stable Audio は、音楽に使用するサンプルを作成しようとするミュージシャンに最適ですが、クリエイターにとってのチャンスは無限です。オーディオトラックは、ユーザーが提供する説明的なテキストプロンプトと、希望するオーディオの長さに応じて生成されます。例えば、”Post-Rock, Guitars, Drum Kit, Bass, Strings, Euphoric, Up-Lifting, Moody, Flowing, Raw, Epic, Sentimental, 125 BPM” と入力し、95秒のトラックをリクエストすると、このトラックが生成されます。

その他トラックは以下から

この基礎となるモデルは、主要な音楽ライブラリである AudioSparx の音楽とメタデータを使用してトレーニングされ、両社のパートナーシップにより、すべての関係者に経済的価値と創造的価値の両方がもたらされます。

Stable Audio は、latent diffusion を利用して、商業利用のための高品質な44.1 kHzの音楽を作成できる初の音楽生成製品です。latent diffusion アーキテクチャは、テキストメタデータとオーディオファイルの長さと開始時刻を条件とするオーディオを使用し、生成されるオーディオの内容と長さを制御することができます。このモデルの背景にある研究の詳細については、こちらをご覧ください。さらに詳しい情報やリリースに関するフィードバックは、research@stability.ai までご連絡ください。

Stable Audio は、www.stableaudio.comでご利用いただけます。

引用