Mistralは1230億パラメータのMistral Large 2を発表

Mistral AIチームは7月24日に、次世代のフラッグシップモデル「Mistral Large 2」の発表を行いました。
従来のモデルと比較して、Mistral Large 2はコード生成、数学、推論において大幅に強化されています。
また、多言語サポートと高度な関数呼び出し機能も強化され、より多彩なAIアプリケーションの構築が可能となりました。

目次

卓越した性能とコスト効率

Mistral Large 2は、128kのコンテキストウィンドウを持ち、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、アラビア語、ヒンディー語、ロシア語、中国語、日本語、韓国語などを含む多数の言語に対応しています。
また、Python、Java、C、C++、JavaScript、Bashなど80以上のプログラミング言語にも対応しています。
このモデルは、1230億パラメータという規模でシングルノードでの高スループットな推論が可能で、長コンテキストアプリケーション向けに設計されています。
Mistral Large 2は、研究および非商業用途向けに使用・改変が可能なMistral Research Licenseの下で提供されており、商業利用にはMistral Commercial Licenseの取得が必要です。

高い性能評価

Mistral Large 2は、コスト効率と性能の新たな基準を打ち立てました。特に、MMLUの評価において、84.0%の正確性を達成し、オープンモデルの性能/コストパレートフロントで新たなポイントを設定しました。

コードと推論の向上

Mistral Large 2は、コード生成において以前のモデルを大幅に上回り、GPT-4o、Claude 3 Opus、Llama 3 405Bなどの先進モデルに匹敵する性能を発揮しています。
また、推論能力の向上にも注力し、事実に基づかない情報を生成する「幻覚」を最小限に抑えるようにトレーニングされています。この結果、数学的ベンチマークでも高い性能を示し、より信頼性の高い出力を提供します。

指示追従とアライメントの強化

Mistral Large 2は、指示追従能力と会話能力の向上にも成功しています。具体的な指示に従い、長い会話をスムーズに処理する能力が大幅に向上しました。
ビジネスアプリケーションにおいて、短く的確な応答が求められる中、Mistral Large 2はその要求に応え、効率的な対話を実現します。

多言語対応と機能呼び出しの強化

Mistral Large 2は、多言語データでのトレーニングにより、多言語文書処理において優れた性能を発揮します。英語をはじめ、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、ロシア語、中国語、日本語、韓国語、アラビア語、ヒンディー語に対応しています。
また、強化された関数呼び出しと取得スキルにより、複雑なビジネスアプリケーションの強力なエンジンとして機能します。

利用と展開

Mistral Large 2は「la Plateforme」で利用可能で、API名は「mistral-large-2407」として提供されています。HuggingFaceにも指示モデルの重みがホストされています。
また、Google Cloud PlatformのVertex AI、Azure AI Studio、Amazon Bedrock、IBM watsonx.aiを通じて、Mistral AIのモデルがグローバルに提供されるようになります。

引用

あわせて読みたい
Large Enough Today, we are announcing Mistral Large 2, the new generation of our flagship model. Compared to its predecessor, Mistral Large 2 is significantly more capable i...
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

目次