今回は2024年7月18日にOpenAIから発表されたGPT-4o miniについて解説します。
GPT-4o miniとは?
GPT-4o miniは、OpenAIが開発した最新の低コストAIモデルです。
このモデルは、小型でありながら高性能を発揮し、特に数学的推論やコーディングタスクで優れた結果を示しています。
具体的には、数学的推論(MGSM)で87.0%、コーディング能力(HumanEval)で87.2%、そしてマルチモーダル推論(MMMU)で59.4%のスコアを記録しています。

また、GPT-4o miniはテキストとビジョンの両方を処理でき、ChatGPTまたはAPIを通じて利用することができます。
GPT-4oとGPT-4o miniの違い
GPT-4oとGPT-4o miniの大きな違いは、性能とコストです。
GPT-4oは、より大規模なモデルであり、より複雑なタスクに対応できますが、その分コストも高くなります。
一方、GPT-4o miniは、低コストでありながら高性能を発揮するように設計されており、より低コストや速度が求めれられる環境に適しています。
機能以外の比較は次のようになります。
モデル | コンテキストウィンドウ | 訓練データ | APIコスト 入力 (100万トークン) | APIコスト 出力 (100万トークン) |
---|---|---|---|---|
GPT-4o | 128,000トークン | 2023年10月まで | $5 / 100万トークン | $15 / 100万トークン |
GPT-4o mini | 128,000トークン | 2023年10月まで | $0.15 / 100万トークン | $0.60 / 100万トークン |
GPT-4oとGPT-4o miniの比較
今回はOpenAIのPlaygroundから比較しています。
ChatGPTで利用する場合とは回答が違う可能性がある点は留意ください。
最初にChatGPTの活用事例を聞いてみました。

紹介する事例数はGPT-4oのより多い例を回答してくれました。
ただ内容の質に大きな違いはありませんでした。。
次にAIが間違えやすい順位の問題を聞いてみました。

どちらも『3位のランナーを抜いたら3位』と正しい回答を示しました。
「次に、自動運転の観点から倫理的な質問をしてみました。

どちらのモデルも歩行者の安全を最優先するという結論に達しましたが、GPT-4oはややロジカルな回答を示す傾向がありました。
次にお礼のメールの文書のドラフトを考えてもらいました。

どちらもそのまま利用しても問題ないようなクオリティですが、ややGPT-4oの方が詳細に回答してくれています。
次にPythonでじゃんけんをするプログラムを生成してもらいました。

実行結果:
GTP-4o

GPT-4o mini

どちらもそのまま実行できました。
最後にマルチモーダル機能について試してみます。
犬の画像から状況を説明してもらいました。


どちらのモデルも、路面が雨で濡れていることやリードで繋がれていることを正確に説明しました。
OCR機能も試してみます。
看板の文字を抽出してもらいます。


本日は休館日です。』という文字を正確に抽出できました。
おわりに
今回はGPT-4o miniの解説からGPT-4oとGPT-4o miniの比較までを詳述しました。
基本的な性能はGPT-4oに迫りながら、APIの利用コストは大きく削減されているなど利用用途によっては革新的なモデルになりそうです。
またChatGPTの無料プランでもGPT-4o miniは十分使えますので、気になったら試してみてください。
GPT-4oの活用事例も紹介していますので、合わせてご覧ください。
