今回はGoogleが提供するマルチモーダルAIモデル、Google Geminiの活用事例をご紹介します。
Geminiは画像やテキストを組み合わせて高度なタスクを実現することができ、その多様な応用が注目されています。
質問の解答
「サントリーオールド」の愛称「だるま」について聞いたところ、GoogleGeminiは完璧な回答をしてくれました。
こういった場面ではGoogleの持っている情報ソースの違いが、他のAIと比べて優れた結果になったのかなと感じました。
ネットスラング風の文章生成
Gemini Pro1.5を使用して、ネットスラングの吉野家構文風の文章生成を試みた事例です。
少し不自然な部分もありますが、非常に特殊で長文の生成もGeminiなら10秒で完了します
コンテキスチュアル広告におけるGeminiの導入事例
日本テレビは、Geminiを活用してコンテキスチュアル広告を導入しました。
LangChain on Vertex AI、Function Calling、Context Cachingなどの技術を組み合わせ、動画のカテゴリ分類情報をBigQueryに入力し、Agent Builderを通じて検索および分析が可能です。
この取り組みは広告エージェントの効率化を目指し、業界に新たな価値を提供しています。
医療分野における活用事例
症例問題を作成させた事例です。
最新のアップデートにより、より自然で正確な日本語の生成が可能となり、そのまま利用できそうなレベルに進化しています。
英語論文の効率的な要約生成
Geminiは、20ページの英語論文をわずか1分で5,000文字に要約する高い処理能力を示しました。
今回は1ファイルのみでしたが、200万トークンという容量ならば多数の論文も処理可能です。
GPT-4やClaudeの性能を超える無料のAIツールとして、学術的な要約作成においても大きな可能性を秘めています。
ゲームキャラクターの設定を生成
複雑なゲームソースブックPDFからキャラクターを生成する能力を示しました。
多くのページを参照し、キャラクターを作成できる点はちょっとした驚きです。
ゲーム開発やデザインの新たな可能性を広げるとことを期待できそうです。
システム画面の動画からプログラムコードを生成
システムの動画から、完全に動作するChatGPTクローンのPythonコードを生成した事例です。
この事例はGeminiの高い動画処理能力と、プログラム生成能力を示しています。
おわりに
今回はGoogle Geminiの多岐にわたる活用事例を紹介しました。
Geminiもどんどん進化しており、特に動画処理や長文の処理・生成などは優れていますね。
興味を持った方は、Geminiの使い方に関する記事もぜひお読みください。