2025年9月20日にxAI は、2Mトークンの長文脈を備えた高効率推論モデル「Grok 4 Fast」を発表しました。
Web版(grok.com/grok.x.com)、iOS/Androidアプリで本日より提供を開始し、OpenRouterとVercel AI Gatewayでは期間限定で無料提供する。xAI APIの価格は入力 1M トークンあたり $0.20、出力 1M トークンあたり $0.50 から。
トークン種別 | 128kトークン未満 | 128kトークン以上 |
---|---|---|
入力トークン | $0.20 / 100万トークン | $0.40 / 100万トークン |
出力トークン | $0.50 / 100万トークン | $1.00 / 100万トークン |
キャッシュ済み入力トークン | $0.05 / 100万トークン | $0.05 / 100万トークン* |
同社は「コスト効率の最前線」を掲げ、Grok 4 で得た知見をもとに小型・高速化と品質の両立を狙う。モデルは推論(Reasoning)と非推論を単一アーキテクチャで統合。全ユーザー、無料利用者を含めて最新モデルへの制限なきアクセスを提供し、「高度AIの民主化」を前進させるとしている。
技術面ではツール使用のRL学習により、コード実行やWeb/X検索の“呼び出し時判断”を最適化。リンク多段遷移や画像・動画の取り込みまで行い、高速に要約・合成する。評価ではLMArenaのSearch Arenaで1位、Text Arenaで8位と報告。平均で思考トークンを40%削減しつつ、同等性能を達成。Artificial Analysisの指標でも価格対知能で最前線に位置づけられた。


Grok 4 Fastは、grok.com のほか iOS/Android アプリでも提供開始済みです。
Fast/Auto の各モードで検索・情報探索の応答が大きく向上し、特にAutoでは難問時に自動でGrok 4 Fastを用いて、品質を損なわずに高速化を実現します。
今回、無料ユーザーを含む“すべてのユーザー”が最新モデルへ制限なくアクセスできるようになり、高度AIの民主化に一歩進みました。
さらに、OpenRouter と Vercel AI Gateway では期間限定で無償提供。開発者向けには、2Mトークン文脈に対応する「grok-4-fast-reasoning」「grok-4-fast-non-reasoning」の2系統をAPIで一般提供し、料金は前掲の表のとおりです。
トークン種別 | 128k トークン未満 | 128k トークン以上 |
---|---|---|
入力トークン | $0.20 / 100万トークン | $0.40 / 100万トークン |
出力トークン | $0.50 / 100万トークン | $1.00 / 100万トークン |
キャッシュ済み入力トークン | $0.05 / 100万トークン | $0.05 / 100万トークン※ |
引用