Amazonは2024年12月3日、AWS re:Inventで次世代の基盤モデル「Amazon Nova」を発表しました。この新しいAIモデル群は、Amazon Bedrockプラットフォーム上で利用可能で、業界トップレベルのインテリジェンスと価格性能比を提供します。
Amazon Novaは、文書や動画の解析、グラフや図表の理解、動画コンテンツの生成、そして高度なAIエージェントの構築など、幅広いジェネレーティブAIタスクを迅速かつ低コストで実現します。また、企業向けのワークロードに最適化された理解モデルと創造的コンテンツ生成モデルの2つのカテゴリを提供します。
Amazon Novaの主な特徴
- テキスト&Visual Intelligenceモデル
- Amazon Nova Micro: テキスト入力専用で、低コストかつ低遅延。最大128Kトークンのコンテキストで、テキスト要約や翻訳、コンテンツ分類、簡易な数理的推論、コーディングに適します。
- Amazon Nova Lite: マルチモーダルモデルで、画像・動画・テキスト入力を高速処理し、高精度な応答を生成します。300Kトークンの入力処理が可能で、リアルタイムの顧客対応や文書解析、ビジュアルQ&Aに特化しています。
- Amazon Nova Pro: テキストとビジュアル情報を高度に処理できる多機能モデル。APIやツールを呼び出して複雑なワークフローを完了させることが可能です。特に金融文書や大規模コードベースの解析に優れています。
- Amazon Nova Premier: 複雑な推論タスクに対応可能な最上位モデルで、2025年初頭の提供開始を予定しています。
- クリエイティブコンテンツ生成モデル
- Amazon Nova Canvas: スタジオ品質の画像生成モデルで、背景の除去や編集、インペイントやアウトペイントが可能です。
- Amazon Nova Reel: テキストプロンプトや参照画像を基に短編動画を生成します。カメラ制御やスタイル調整も可能で、広告やエンターテインメントに最適です。
Amazon Novaは、文書解析や動画分析から動画生成まで多岐にわたる用途に対応します。
例えば、Amazon Nova Proを利用してPDF文書を要約し、意思決定ツリーを自動生成したり、動画を解析して内容を説明することが可能です。
さらに、Amazon Nova Reelを使用すると、自然言語プロンプトを基にした動画生成が数分で完了します。
Amazon Novaモデルは現在、米国東部(バージニア北部)AWSリージョンで利用可能で、一部のモデルは他のリージョンでも提供されています。料金はAmazon Bedrockの従量課金制に基づきます。
Amazon Novaは200以上の言語に対応しており、企業がグローバルなアプリケーションを構築する際に言語の壁を取り除きます。
また、独自のデータでモデルをカスタマイズすることも可能で、業界固有の用語やブランドスタイルに合わせた最適化が行えます。
引用