AITuberなどのリアルタイム配信システムとの生成音声の統合や、大規模コンテンツ生成の効率化を実現
株式会Algomatic(本社:東京都港区、代表取締役:大野 峻典、以下 Algomatic)は、2024年12月11日、AIを活用した音声生成プラットフォーム『にじボイス』( https://nijivoice.com/ )において、動画コンテンツ事業者向けに『にじボイスAPI』を正式公開したことをお知らせいたします。これにより、AITuberなどのリアルタイム配信システムとの生成音声の統合や大規模コンテンツ生成の効率化を実現し、生成音声を活用したこれまでにない新たな事業領域の開拓を促進してまいります。
『にじボイス』は、AIを活用した感情豊かな音声を生成するプラットフォームです。キャラクターを選択しテキストを入力することで、誰でも簡単に感情豊かな音声を生成することができます。2024年11月に、クローズドβ版をリリースし、その後『にじボイス』β版として提供。同年12月には、『にじボイス』正式リリースとともに、ボイスパートナーへの収益還元を開始し、生成対象の文字数に140字の制限がありながらも、約1カ月間での累積生成文字数は約3,000万文字規模に到達しています。
この度、これまで200社以上の企業のみなさまからいただいてきた要望にお応えし、『にじボイスAPI』を正式公開する運びとなりました。入力テキストに応じて自動的に感情表現を変化させる革新的なTTS(Text-to-Speech)機能を中心にAPIとして拡張。感情パラメーターを逐一設定する必要がないため、大規模コンテンツの制作においても、“空気を読んだ”音声生成を実現することが可能となり、ライブ配信や動画自動生成といった事前チェックが難しい場面においても、ユーザーに最適化した音声コンテンツをスピーディーに提供することができます。既存システムと連携したリアルタイムでの音声生成や、モバイルアプリやIoTデバイスなどのアプリケーションへの組み込みによる動的な音声生成に加えて、下記のような活用を促進します。
■『にじボイスAPI』によって可能になること
- リアルタイム配信システムとの統合
配信プラットフォームと連携し、コメントやコンテンツなどでのライブ情報に合わせて音声を生成し、より優れたコンテンツを提供します。 - 大規模コンテンツの効率化複数トラックへの一括での音声生成、字幕の自動音声化、研修コンテンツやマニュアルの音声生成など、音声を含む大規模なコンテンツ制作での生産性向上を実現します。
- 多彩なキャラクターによる高度な音声体験キャラクター情報取得APIを活用し、計100体の老若男女さまざまなキャラクター情報を参照可能。ユーザーの応答や利用状況に合わせて適切なキャラクターを選択し、より深い没入感のある音声体験を実現します。
『にじボイス』では、引き続き声の持ち主の権利と意志を守りながら、生成音声の表現とその可能性の拡張に取り組んでまいります。
【にじボイス 事業責任者 コメント】
原田 祐二(株式会社Algomatic 執行役員 Algomatic Global カンパニーCEO)
『にじボイス』は、さまざまな企業の皆さまが新たな価値を創造し、それぞれのビジネスをさらに進化させるお手伝いをするために生まれました。
なかでも特に、AITuberやリアルタイムAI、動画生成AIなどの革新的な技術と組み合わせることで、これまでにないスピードで新たなビジネスの可能性が広がっていくと確信しています。
このAPIが、皆さまのアイデアを形にする一助となり、未来を共に切り拓いていく存在となっていければと願っています。
・note:https://note.com/1230yuji/
・X:https://x.com/1230yuji
【Algomaticについて】
社 名 :株式会社Algomatic
所在地 :東京都港区六本木三丁目2番1号
代表者 :大野 峻典
設 立 :2023年4月13日
事業内容: 大規模言語モデル等生成AI技術を活用した、サービスの開発・提供
URL:https://algomatic.jp/
引用