OpenAIは9月25日に、ChatGPTに音声や画像認識などのマルチモーダル機能を実装すると発表しました。
今後2週間で、ChatGPTの音声と画像機能はPlusとEnterpriseのユーザーに提供される予定です。
音声認識はiOSとAndroidで利用できるようになるし、画像認識はすべてのプラットフォームで利用可能となります。
目次
音声認識
音声チャットやリアルタイム翻訳をすることができます。
あなたの声を使ってChatGPTと対話を楽しんでください。
外出中でも、寝る前の物語をリクエストしたり、食事の時の議論に結論付けたりすることができます。
画像認識
ChatGPTに画像を認識させることができます。
1つだけでなく複数の画像をアップロードすることもできます。
これによって、グリルが起動しない理由をトラブルシュートしたり、冷蔵庫の中身から献立をつくったり、紙のデータをデジタル化して分析することができます。
引用