2025年9月25日にGoogleは、生成AIモデル「Gemini 2.5 Flash」と「Gemini 2.5 Flash-Lite」のプレビュー版を同時に更新し、品質と応答速度の両方を大幅に向上させました。これらのモデルは、Google AI StudioとVertex AIを通じて提供されており、出力トークン効率の改善により、運用コストの削減も期待できます。
主な改善点
今回の刷新では、Flash-Liteを中心に以下の改善が図られました:
- 指示追従性の強化
- 冗長性の低減
- マルチモーダル機能と翻訳精度の向上
これらの改善により、出力トークン数はFlash-Liteで最大50%、Flashで24%削減され、同等の品質を維持しながらも、より低コスト・低レイテンシでの運用が可能となりました。


性能向上の詳細
Flashにおけるツール活用機能(エージェント的推論)が大幅に改善され、SWE-Bench Verifiedベンチマークにおいて5ポイントの向上(48.9%→54%)を記録しました。また、思考モード有効時のコスト効率も向上しております。
試験用モデルは以下の名称で公開されています:
gemini-2.5-flash-preview-09-2025
gemini-2.5-flash-lite-preview-09-2025
新機能「-latest」エイリアスの導入
今回、常に最新モデルに自動更新される「-latest」エイリアス機能も導入されました:
gemini-flash-latest
gemini-flash-lite-latest
これらのエイリアスでは、モデルの更新や廃止の2週間前にメール通知が送信されます。ただし、レート制限や機能が変動する可能性があるため、安定した運用には従来の安定版(gemini-2.5-flash
/gemini-2.5-flash-lite
)の使用が推奨されています。
引用
あわせて読みたい


Continuing to bring you our latest models, with an improved Gemini 2.5 Flash and Flash-Lite release
Google is releasing updated Gemini 2.5 Flash and Flash-Lite preview models with improved quality, speed, and efficiency.