OpenAIは10月1日にサンフランシスコで開催されたDevDayで、開発者向けに最新のAI技術やAPIのアップデートを紹介しました。
主な発表内容は以下の通りです。
- Realtime API
Realtime APIは、低遅延でマルチモーダルな会話体験を構築できる機能を提供します。
機能としては、ChatGPT の Advanced VoiceをAPIとして利用できるもので、現在、テキストと音声の入力および出力、さらに機能呼び出しをサポートしています。
Realtime APIを利用することで、ほぼリアルタイムの音声対話体験をアプリケーションに組み込むことができます。
現在、Realtime APIはパブリックベータ版として発表され、6つの異なる音声から選択できます。
- Prompt Caching
使用頻度の高いコンテキストをキャッシュすることで、APIコールのコストを自動的に削減する機能です。
これにより、レイテンシが最大80%短縮され、長いプロンプトではコストが50%削減される可能性があります。プロンプトキャッシングは、すべてのAPIリクエストで自動的に機能し(コードの変更は不要)、追加料金は発生しません。
プロンプトキャッシングは以下のモデルで有効です:- gpt-4o
- gpt-4o-mini
- o1-preview
- o1-mini
- Model Distillation:
大規模モデルのアウトプットを利用して、小規模モデルをfine-tuneし、特定のタスクで同様のパフォーマンスを達成できるようにするプロセスです。。
これにより、より小さなモデルでも大規模モデルに近いパフォーマンスを発揮できるようになります。
- Vision Fine-Tuning for GPT-4o
GPT-4oがマルチモーダル微調整に対応しました。
これにより、画像入力に基づいたモデルでもfine-tuneingが可能になりました。
また、2024年10 月 31 日までは、1 日あたり最大 100 万トークンまでは無料でトレーニングできます。
- New Playground features
新しいPlaygroundの機能では、アイデアを素早くプロトタイプに変換できます。
モデルの用途を説明するだけで、Playgroundが自動的にプロンプトや機能、構造化された出力のための適切なスキーマを生成してくれます。
- o1 APIのアクセス拡大
OpenAI o1 APIがTire3開発者まで拡大しました、
またそれに伴い、利用制限も以下のように引き上げられました。- Tier 5
o1-preview: 10,000 requests per minute
o1-mini: 30,000 requests per minute - Tier 4
o1-preview and o1-mini: 10,000 requests per minute - Tier 3
o1-preview and o1-mini: 5,000 requests per minute
- Tier 5