【解説】生成AI(ジェネレーティブAI)とは?

【解説】生成AI(ジェネレーティブAI)とは? 用語解説

生成AI(ジェネレーティブAI)とは?

生成AI(ジェネレーティブAI)とは、人工知能(AI)が自らデータを生成する技術のことです。
例えば、画像や音声、文章などのメディアコンテンツをAIが作り出すことができます。
生成AIを利用すれば、従来人間にしか出来なかったようなクリエイティブな創作物やアイデアを生成することが出来ます。

生成AI(ジェネレーティブAI)の仕組み

生成AIは、主に深層学習(ディープラーニング)というAIの一種を用いて実現されます。
深層学習とは、多層のニューラルネットワークと呼ばれる人間の脳の仕組みに似た計算モデルを使って、大量のデータから特徴やパターンを学習する技術です。

生成AIでは、特に敵対的生成ネットワーク(GAN)という深層学習の手法がよく使われます。
GANとは、生成器(Generator)と識別器(Discriminator)という二つのニューラルネットワークが互いに競争しながら学習する仕組みです。

実際にリアルのデータと生成されたデータを、それぞれ識別させ、生成AIで生成されたデータを本物に近づけていく手法です。
このようにして、生成器は識別器を騙せるほど高品質なデータを生成するようになります。

生成AI(ジェネレーティブAI)の種類

生成AIは、生成するデータの種類や目的によって様々な分野に応用されています。代表的なものを以下に紹介します。

  • テキスト生成AI
    テキスト生成AIとは、文章やテキストなどの言語データをAIが作成します。
    ニュースや小説、詩などの文書を執筆したり、要約や翻訳、対話などの言語処理を行ったりすることができます。
  • 画像生成AI
    画像生成AIとは、テキストやスケッチなどの入力から、AIが画像やイラストを自動で生成する技術のことです。
  • 音声生成AI
    音声生成AIとは、テキストや音声サンプルなどの入力から、AIが人の声を自動で生成する技術のことです
  • 動画生成AI
    動画生成AIは、テキストや画像などの入力から、動画の内容やスタイルを自動的に生成することができます。

代表的な生成AI(ジェネレーティブAI)のサービス

ここでは、代表的なAIサービスを紹介します。

テキスト生成AI

ChatGPT

ChatGPTは、OpenAIによって訓練された大規模な言語モデルで、自然言語処理(NLP)の一部です。このモデルは、大量のテキストデータからパターンを学習し、人間のように文章を生成することができます。

Introducing ChatGPT
We’vetrainedamodelcalledChatGPTwhichinteractsinaconversationalway.ThedialogueformatmakesitpossibleforChatGPTtoanswerfollowupquestions,admititsmistakes,challenge...
Google Bard

Google Bardとは、Googleが開発・提供している対話型AIサービスです。
Google Bardは、テキストや音声の入力に対して、AIが自動で返信文を生成することができます。

Try Bard, an AI experiment by Google
Bardisyourcreativeandhelpfulcollaboratortosuperchargeyourimagination,boostproductivity,andbringideastolife.
BingAI

Bing AIとは、Microsoftが提供する検索エンジン「Bing」にGPT-4搭載の「AIチャット」を組み込んだサービスです。
Bing AIは、テキストや音声の入力に対して、AIが自動で返信文を生成することができます。

Bing AI - Bing
Bingのインテリジェント検索機能により、探しているものをより簡単にすばやく見つけられるようになり、リワードも得られます。

画像生成AI

Stable Diffusion

Stable Diffusionとは、テキストを入力するとそれに沿った画像を生成してくれるAIモデルです。
Stable Diffusionは、オープンソースで公開されており、自分のパソコンやネット上のサービスで使うことができます。

Stable Diffusion — Stability AI
ExperienceunparalleledimagegenerationcapabilitieswithStableDiffusionXL.Ourmodelusesshorterpromptsandgeneratesdescriptiveimageswithenhancedcompositionandrealisti...
Midjiourney

Midjiourneyとは、テキストの説明文から画像を作成する独自のAIです。

Midjourney
Anindependentresearchlabexploringnewmediumsofthoughtandexpandingtheimaginativepowersofthehumanspecies.
DALL-E

DALL-Eとは、OpenAIにより開発された深層学習モデルで、自然言語の記述からデジタル画像を生成することができます。
DALL-Eは2021年1月に発表されましたが、その後バージョンアップされてDALL-E 2に名称を変更しました。

DALL·E 2
DALL·E2isanAIsystemthatcancreaterealisticimagesandartfromadescriptioninnaturallanguage.

音声生成AI

MusicLM

MusicLMとは、Googleが開発したAI搭載の音楽生成モデルです。
文章で書かれたプロンプトをもとに、その内容にふさわしい音楽を自動で作成することができます。

AI Test Kitchen
Jukebox

OpenAIのJukeboxは、音楽を生成するためのAIモデルです。
Jukeboxは、大量の音楽データから学習し、新しい曲を生成する能力を持っています。

Jukebox
We’reintroducingJukebox,aneuralnetthatgeneratesmusic,includingrudimentarysinging,asrawaudioinavarietyofgenresandartiststyles.We’rereleasingthemodelweightsandcod...

動画生成AI

Runaway

動画生成AIのRunawayとは、テキストで動画を編集・生成できるAIシステムです。
RunwayというAIを搭載したビデオ編集プラットフォームの一機能として提供されています。

Runway - Advancing creativity with artificial intelligence.
RunwayisanappliedAIresearchcompanyshapingthenexteraofart,entertainmentandhumancreativity.
Stable Diffusion Video

Stable Diffusion Videoとは、画像生成AIのStable Diffusionを用いて動画を生成するライブラリです。
テキストや画像を入力すると、それに応じた動画を生成できます。

Releases · nateraw/stable-diffusion-videos
Create🔥videoswithStableDiffusionbyexploringthelatentspaceandmorphingbetweentextprompts-nateraw/stable-diffusion-videos

おわりに

ChatGPTだけでなく、さまざまな生成AI(ジェネレーティブAI)が登場しています。
これらのAIは、自分たちの生活を豊かにしたり、ビジネスやエンターテイメント、教育などの分野においても革新的な変化をもたらしてくれそうです。
今後も同分野の発展が楽しみですね。

AI・DX・LowCodeなど企業に役立つ情報を発信しています。



タイトルとURLをコピーしました