Microsoft AI、自社開発基盤モデル「MAI-1-preview」および音声生成モデル「MAI-Voice-1」を発表

2025年8月28日、Microsoft CorporationのAI部門であるMicrosoft AI(MAI)は、同社初となる完全自社開発の基盤モデル2種類を正式に発表した。テキスト生成に特化した大規模言語モデル「MAI-1-preview」と、高効率音声生成モデル「MAI-Voice-1」の公開により、同社のAI戦略における重要な転換点が示された。

MAI-Voice-1は、1分間の高品質音声を単一のGPUで1秒未満という極めて短時間で生成可能な音声合成モデルである。この処理速度は、現在利用可能な音声生成システムの中でも最高水準の効率性を実現している。本モデルは既にMicrosoft Copilot DailyおよびPodcastsサービスにおいて稼働しており、実用段階に入っている。さらに、Copilot Labsにおいて、表現豊かな音声生成やストーリーテリング機能のデモンストレーションが提供されており、ユーザーは簡単なプロンプトから独自の物語や瞑想ガイドを作成することが可能となっている。

一方、MAI-1-previewは、Mixture-of-Experts(MoE)アーキテクチャを採用した基盤言語モデルである。約15,000基のNVIDIA H100 GPUを使用して事前学習および事後学習が実施されており、指示追従と日常的なクエリへの有用な応答の提供に特化した設計となっている。現在、コミュニティ主導のモデル評価プラットフォームであるLMArenaにおいて公開テストが実施されている。

Microsoft AIは、今後数週間以内にCopilotの特定のテキスト使用事例において本モデルの段階的な展開を予定しており、ユーザーフィードバックに基づく継続的な改善を計画している。LMArenaでの公開評価に加えて、信頼できるテスター向けのAPIアクセスも開始されており、モデルの性能評価と改善点の特定を加速させる方針である。

MAI-1-previewの開発において特筆すべきは、その効率性である。競合他社の同規模モデルが10万基以上のGPUを使用する中、Microsoft AIは約15,000基という比較的少ない計算資源で競争力のあるモデルの構築に成功した。これは、高品質なデータの選定と最適化技術の活用によるものであり、同社の技術力の高さを示している。

Microsoft AIは、次世代GB200クラスタが既に稼働を開始したことも明らかにした。この最新のインフラストラクチャにより、今後の大規模モデル開発と展開に必要な計算能力が確保されている。同社は、自社開発モデル、パートナー企業のモデル、オープンソースコミュニティの最新イノベーションを組み合わせた柔軟なアプローチを継続する方針を示している。この戦略により、日々数百万件に及ぶ多様なユーザーインタラクションにおいて最適な結果を提供することが可能となる。

今回の発表は、Microsoft CorporationがAI分野において、単なるプラットフォーム提供者から技術革新の主導者へと転換を図る明確な意思表示といえる。同社は「すべての人々に力を与えるAI」というビジョンの下、異なる専門性を持つ複数のモデルを統合的に運用することで、様々なユーザーニーズと使用事例に対応し、大きな価値を創出することを目指している。

特にMAI-Voice-1が実現した処理速度は、リアルタイムAIアプリケーションの新たな可能性を開くものであり、業界全体に大きな影響を与えることが予想される。OpenAIとの戦略的パートナーシップを維持しながら、独自の技術開発能力を強化するという同社の方針は、技術的リスクの分散と継続的イノベーションの両立を図る合理的な戦略として評価できる。

Microsoft AIは現在、次世代モデル開発に向けて優秀な人材の採用を積極的に進めている。同社は世界最高水準のチームとインフラストラクチャを基盤として、次世代モデルの開発を加速させる計画であり、グローバル規模でポジティブな影響を創出する機会を提供している。

今後、これらのモデルがMicrosoft製品群にどのように統合され、エンタープライズおよびコンシューマー市場にどのような価値を提供するか、その動向が注目される。

引用

Two in-house models in support of our mission   | Microsoft AI

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

目次