OpenAIは2025年3月26日、GPT-4oに搭載された最新の画像生成機能「4o Image Generation」を発表しました。この新しい機能により、GPT-4oは単なる美しい画像を生成するだけではなく、実用的かつ正確でリアルな視覚表現を生み出せるようになりました。
この機能は2025年3月26日より、ChatGPTおよびSoraにて提供が開始されており、Plus、Pro、Team、Freeのすべてのユーザーが利用可能です。
従来の生成モデルは幻想的で美しい画像を作り出すことが可能でしたが、図解やロゴなど、コミュニケーションや情報共有を目的とした実務的な画像を生成することには限界がありました。しかしGPT-4oはテキストと画像の結びつきを深め、アップロードされた画像や会話のコンテキストを的確に反映し、ユーザーが求める精密な視覚情報を提供します。
GPT-4oの画像生成は、オンラインで収集された大量の画像とテキストデータを基に訓練されました。この結果、GPT-4oは単なる画像の美しさだけでなく、画像間の関連性や文脈理解力にも優れています。例えば、ホワイトボード上での議論内容を自然な手書きで表現した画像や、正確なテキスト配置によって意味を強調した画像の生成などが可能になりました。
さらに、GPT-4oでは「マルチターン生成」機能が強化され、ユーザーは自然な会話を通じて画像を細かく調整できます。例えば、ゲームキャラクターのデザインを行う際に、前回の指示や画像を参照しながら連続的に修正を加えられるため、一貫性のあるビジュアル制作が可能です。
OpenAIはこの画像生成能力により、コミュニケーション手段としての画像活用をより効果的かつ精度高く実現することを目指しています。今後、GPT-4oは画像生成分野における実用的かつ強力なツールとして、広く利用されていくことが期待されています。
詳しくはChatGPTで実際に試すことが可能です。
引用