進化した画像生成AI Stable Diffusion 3 APIを使ってみた

ChatGPT

今回はStability.aiが発表した最新の画像生成AI「Stable Diffusion 3」の使い方について解説していきます。

Stable Diffusion 3 APIについては次の記事から

Stable Diffusion 3 APIの料金

Stable Diffusion 3のAIモデルは2種類用意されており高機能なStable Diffusion 3.0(SD3)と低価格で高速なStable Diffusion 3.0 Turbo(SD3 Turbo)が利用できます。
APIの利用には事前にクレジットを購入する必要があります。
※アカウント開設時25クレジットが付与されます。
10ドルで1000クレジットですので、SD3で0.065$でSD3 Turboで0.04$になります。

Stable Diffusion 3 APIの使い方

次のURLにアクセスします。

Stability AI – Developer Platform

「Login」をクリックして下さい。

「Sign up」をクリックして下さい。

Googleアカウントまたはメールアドレスでアカウントを作成して下さい。
アカウントログイン後、右上のプロフィールをクリックして下さい。
APIキーが表示されるので大切に保管して下さい。

今回はFireworks.aiを利用して画像を生成しようと思います。
アカウント作成が必要ですので次の記事を参考に実践して下さい。

Fireworks.aiのアカウントを作成しログインが完了したらトップバーの「Models」から「Stable Diffusion 3」を選択して下さい。

Stability API KeyのところにAPIキーを入力して下さい。

最初に風景の画像を生成してみようと思いましたが記事執筆時点(24年4月)では日本語には対応していないみたいです。

ですので英語に翻訳して入力します。

プロンプト:

早朝の静かな海辺、空は淡いオレンジ色で、水平線には穏やかに昇る太陽。砂浜には色とりどりの貝殻が散らばり、小さな波が静かに打ち寄せている。遠くには小さなヨットが見える。

翻訳プロンプト:

An early morning at a quiet seaside, the sky painted in pale orange hues with the sun gently rising over the horizon. The sandy beach is scattered with colorful seashells, and small waves quietly lap against the shore. In the distance, a small yacht can be seen.

全て要素を盛り込んだ画像を生成してくれました。

最後にStable Diffusion 3の特徴として文字を画像に反映することができるとのことですので、文字入りの画像を生成してみます。

プロンプト:

手書き風の文字で「Welcome to the Cozy Corner」と書かれたかわいいカフェの看板。看板は木製で、花や緑に囲まれている。背景にはカフェの窓が見え、中からは温かい光が漏れている。

翻訳プロンプト:

A cute cafe sign written in a handwritten style that reads 'Welcome to the Cozy Corner'. The sign is made of wood and is surrounded by flowers and greenery. In the background, the cafe windows are visible, with warm light spilling out from inside.

きちんと指定した文字入りの画像を生成してくれました。

おわりに

今回はStability.aiが開発した画像生成AI「Stable Diffusion 3」の使い方、料金、および実際に画像を生成するプロセスについて解説しました。
1枚生成するのに10円くらいかかるのでコストはやや高めですが、それに見合った精度の画像を生成してくれます。
今はAPIでしか利用できないですが、今後もっと使いやすい形のサービスで展開されると嬉しいですね。

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

タイトルとURLをコピーしました