xAIは4月23日、新たに「Grok Vision」機能と多言語音声対応、そしてVoice Mode内でのリアルタイム検索を発表した。
「Grok Vision」は、スマートフォンのカメラを通じて現実世界の物体やテキストを解析し、アプリ上で即座に質問応答や分析を行える機能だ。これにより、画像内のグラフや看板、雑誌の一部などをリアルタイムで「読み取り」、ユーザーの問いに応じた的確な情報を返すことが可能となる。
次に、多言語音声対応機能では、以下の言語での音声対話がサポートされるようになった:
- スペイン語(Grok habla español)
- フランス語(Grok parle français)
- トルコ語(Grok Türkçe konuşuyor)
- 日本語(グロクは日本語を話す)
- ヒンディー語(ग्रोक हिंदी बोलता है)
これにより、Voice Modeを選択すれば、従来のテキスト入力に加え、ネイティブスピーカーによるような会話体験が実現。リアルタイムでの文字起こしも内蔵しているため、発言内容が即座にテキストに反映される。
さらに、Voice Mode内でのウェブ検索機能が統合され、音声対話を途切れさせることなく最新情報を引き出し、そのまま会話を続行できるようになった。この「リアルタイム検索」は、質問内容に合わせてインターネット上の最新データを即時取得し、Grokがそのまま応答に活かす。
今回のアップデートは、全iOSユーザー向けに即日提供が開始されており、App Storeから最新版アプリをダウンロードするだけでアクセス可能だ(apps.apple.comより)。加えて、SuperGrokサブスクリプションを契約しているAndroidユーザーも、多言語音声とリアルタイム検索機能を利用できる。
引用