Grok、Vision解析と多言語音声対応、Voice Modeにリアルタイム検索を追加——全iOSユーザー向けに提供開始

xAIは4月23日、新たに「Grok Vision」機能と多言語音声対応、そしてVoice Mode内でのリアルタイム検索を発表した。

「Grok Vision」は、スマートフォンのカメラを通じて現実世界の物体やテキストを解析し、アプリ上で即座に質問応答や分析を行える機能だ。これにより、画像内のグラフや看板、雑誌の一部などをリアルタイムで「読み取り」、ユーザーの問いに応じた的確な情報を返すことが可能となる。

次に、多言語音声対応機能では、以下の言語での音声対話がサポートされるようになった:

  • スペイン語(Grok habla español)
  • フランス語(Grok parle français)
  • トルコ語(Grok Türkçe konuşuyor)
  • 日本語(グロクは日本語を話す)
  • ヒンディー語(ग्रोक हिंदी बोलता है)

これにより、Voice Modeを選択すれば、従来のテキスト入力に加え、ネイティブスピーカーによるような会話体験が実現。リアルタイムでの文字起こしも内蔵しているため、発言内容が即座にテキストに反映される。

さらに、Voice Mode内でのウェブ検索機能が統合され、音声対話を途切れさせることなく最新情報を引き出し、そのまま会話を続行できるようになった。この「リアルタイム検索」は、質問内容に合わせてインターネット上の最新データを即時取得し、Grokがそのまま応答に活かす。

今回のアップデートは、全iOSユーザー向けに即日提供が開始されており、App Storeから最新版アプリをダウンロードするだけでアクセス可能だ(apps.apple.comより)。加えて、SuperGrokサブスクリプションを契約しているAndroidユーザーも、多言語音声とリアルタイム検索機能を利用できる。

引用


よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

目次