【マルチモーダルが大幅進化】GPT4o活用事例の紹介

今回はGPT4oの活用事例を紹介します。
日本語能力からマルチモーダル性能など従来のGPT-4からさまざまな性能が強化されているようです。

目次

手書きの画像からWebフォームの作成

GPT-4oで手書きのフォーム画像をHTMLを書き起こした事例です。
日本語をきちんと読み取っている他、フォームの内容まできちんと理解しているのは凄いですね。

手書きノートのデジタル化

手書きの講義ノートをGPT-4に見せ、要約とTeXファイルの生成を依頼した事例です。
その結果、数式もほぼ正確に認識されています。

3Dプリント用のファイル形式

ChatGPTによるSTLファイルの生成例です。
シンプルなテーブルのデザインが生成されています。

短時間で詳細なチャートと分析を生成

ChatGPTのGPT-4oが、スプレッドシートからわずか30秒で完全なチャートと統計分析を生成しました。
Excelで数時間かかる作業が、今では一瞬で完了するようになりそうです。

日本語OCRの精度が飛躍的に向上

GPT-4oが、本のページを送るだけで図版のレイアウトも加味した完璧な書き起こしをしてくれます!
色々な応用ができそうですね。

画像解析で文字を書き出す

GPT-4oの高い画像解析能力の事例です。
細かい企業名やカテゴリをのカオスマップ正確に読み取り、企業名を書き出すことに成功しています。
これは凄い。

イラストの出典を特定

GPT-4oが、イラストを渡すだけでWeb検索を行い作者や掲載先のURLを特定しました。
気に入ったイラストの出典を見つけることが簡単になりそうです。

東大数学問題も正解

GPT-4oが、東大数学2024の問題を画像で送っただけで正解を導き出しました。
プロンプトなしでも正確に解答できたそうです。
ただし他のポストでは間違いもあったみたいですので過信は禁物です。

仕訳も完璧

ChatGPT-4oが、レシートの画像を元に正確な仕訳を作成しました。
仕訳の解説も行ってくれるので、会計業務が非常にスムーズになります。

マジック:ザ・ギャザリングのシミュレーションも

GPT-4oが、マジック:ザ・ギャザリングのシミュレーションを驚くほど正確に行いました。
雑談から始めたゲームが、本格的なシミュレーションに発展し、楽しませてくれます。
ボードゲームなどAIと遊べそうですね。

おわりに

今回はGPT4oの活用事例を紹介しました。
特に旧バージョンのGPT-4と比べてもマルチモーダルや長文に強くなっている印象です。
今後音声機能のアップデートやデスクアップアプリも登場しますし、ますます進化から目が離せないですね。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

目次