Mistral AIチームは7月24日に、次世代のフラッグシップモデル「Mistral Large 2」の発表を行いました。
従来のモデルと比較して、Mistral Large 2はコード生成、数学、推論において大幅に強化されています。
また、多言語サポートと高度な関数呼び出し機能も強化され、より多彩なAIアプリケーションの構築が可能となりました。
卓越した性能とコスト効率
Mistral Large 2は、128kのコンテキストウィンドウを持ち、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、アラビア語、ヒンディー語、ロシア語、中国語、日本語、韓国語などを含む多数の言語に対応しています。
また、Python、Java、C、C++、JavaScript、Bashなど80以上のプログラミング言語にも対応しています。
このモデルは、1230億パラメータという規模でシングルノードでの高スループットな推論が可能で、長コンテキストアプリケーション向けに設計されています。
Mistral Large 2は、研究および非商業用途向けに使用・改変が可能なMistral Research Licenseの下で提供されており、商業利用にはMistral Commercial Licenseの取得が必要です。
高い性能評価
Mistral Large 2は、コスト効率と性能の新たな基準を打ち立てました。特に、MMLUの評価において、84.0%の正確性を達成し、オープンモデルの性能/コストパレートフロントで新たなポイントを設定しました。
コードと推論の向上
Mistral Large 2は、コード生成において以前のモデルを大幅に上回り、GPT-4o、Claude 3 Opus、Llama 3 405Bなどの先進モデルに匹敵する性能を発揮しています。
また、推論能力の向上にも注力し、事実に基づかない情報を生成する「幻覚」を最小限に抑えるようにトレーニングされています。この結果、数学的ベンチマークでも高い性能を示し、より信頼性の高い出力を提供します。
指示追従とアライメントの強化
Mistral Large 2は、指示追従能力と会話能力の向上にも成功しています。具体的な指示に従い、長い会話をスムーズに処理する能力が大幅に向上しました。
ビジネスアプリケーションにおいて、短く的確な応答が求められる中、Mistral Large 2はその要求に応え、効率的な対話を実現します。
多言語対応と機能呼び出しの強化
Mistral Large 2は、多言語データでのトレーニングにより、多言語文書処理において優れた性能を発揮します。英語をはじめ、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、ロシア語、中国語、日本語、韓国語、アラビア語、ヒンディー語に対応しています。
また、強化された関数呼び出しと取得スキルにより、複雑なビジネスアプリケーションの強力なエンジンとして機能します。
利用と展開
Mistral Large 2は「la Plateforme」で利用可能で、API名は「mistral-large-2407」として提供されています。HuggingFaceにも指示モデルの重みがホストされています。
また、Google Cloud PlatformのVertex AI、Azure AI Studio、Amazon Bedrock、IBM watsonx.aiを通じて、Mistral AIのモデルがグローバルに提供されるようになります。
引用