AMD iGPUで高速生成の軽量画像生成AI「Nitro-E」を公開

AMDは2025年10月24日に、テキストから高品質な画像を生成する軽量拡散トランスフォーマーモデル「Nitro-E」を公開した。
パラメータ数は304Mと小型ながら画質と速度を両立し、同社の最新iGPU(Strix Halo)でも512px画像を0.16秒で生成できるのが特徴だ。

Nitro-Eは、ディフュージョン・トランスフォーマー系の設計(E-MMDiT)を採用し、従来主流だったU-Netからの世代交代を象徴する位置付けだ。
AMDは2025年7月に同系統の「Nitro-T」を発表しており、効率重視の画像生成モデル群としてラインアップを拡充してきた。

技術面では、単一ノード(Instinct MI300X ×8)で約1.5日という短期間で学習を完了。推論では、MI300X単体で512px・バッチ32時に18.8 samples/sを記録し、蒸留版では39.3 samples/sまで向上する。
モデルはMITライセンスでHugging Faceから提供され、512px/1024pxのチェックポイントや学習・推論手順が公開されている。

実運用の観点では、データセンターGPUに限らずRyzen系iGPUでも高速生成が可能なため、生成AIのオンデバイス実行やエッジ側のプロトタイピング、低コストな配信基盤の構築を後押しする。
AMDのROCmスタックと併用することで、PyTorchやDiffusersとの親和性も高く、既存ワークフローへの組み込みが容易だ。

引用

Nitro-E: A 304M Diffusion Transformer Model for High Quality Image Generation — ROCm Blogs

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

目次