ビジュアルクリエイションをより高いレベルへ導く100のオープンソースQwen 2.5マルチモーダルモデルと新しいText-to-Video AIモデルを発表/クラウドインフラを刷新
アリババグループのデータ・インテリジェンスの中枢であるアリババクラウドは本日、同社の年次イベント「Apsara Conference 2024」にて、新たに立ち上げた100種類以上の大型言語モデル「Qwen 2.5」を世界のオープンソースコミュニティに公開したことを発表しました。
また、アリババクラウドは、強力なAIコンピューティング需要に対応するために設計されたフルスタックのインフラの刷新を発表しました。この新しいインフラには、コンピューティング、ネットワーキング、データセンター・アーキテクチャーを強化する革新的なクラウド製品とサービスが含まれており、これらすべては、AIモデルの活発な開発と広範なアプリケーションを支援することを目的としています。
アリババクラウドの会長兼最高経営責任者(CEO)である呉 泳銘(Eddie Wu)は、次のように述べています。
「アリババクラウドは、これまで以上に、AI技術の研究開発とグローバルインフラの構築に投資しています。当社の目標は、グローバルなお客様にさらに貢献し、彼らのビジネスを一層発展させるため、未来のAIインフラを整備することです。」
100のオープンソースモデルを発表
新たに公開されたオープンソースのQwen 2.5モデルは、5〜720億のパラメータサイズを持ち、ナレッジが強化され、数学やコーディングの機能がさらに強力になり、29以上の言語に対応しています。自動車、ゲーム、科学研究などのさまざまな分野におけるエッジやクラウドにおける幅広いAIアプリケーションをサポートしています。
アリババクラウドの独自開発による大型言語モデル群「Qwenモデルシリーズ」は、2023年4月のデビュー以来、多くの利用者に支持されています。これまでにQwenモデルは、オープンソースAIコミュニティの主要プラットフォームであるHugging Faceや、アリババによるオープンソースコミュニティ「ModelScope」などのプラットフォームで、4,000万回以上のダウンロードを記録しています。さらに、Hugging Face上では、これらのモデルからインスピレーションを受けて、5万を超えるモデルが作成されています。
今回のQwen 2.5リリースでは、100以上のモデルがオープンソース化されます。この広範なラインアップは、ベースモデル、指示モデル、さまざまな精度レベルと手法の量子化モデルが含まれており、言語、音声、映像などの多様なモダリティに対応するほか、コードや数学に特化したモデルも提供されます。
アリババクラウドの最高技術責任者(CTO)である周 靖人(Jingren Zhou)は、次のように述べています。
「本日は、これまでの中で最大規模のオープンソースイニシアチブを発表できる大きな節目となりました。この取り組みは、さまざまな規模の開発者や企業がAI技術をより活用できるよう支援し、オープンソースコミュニティのさらなる成長に貢献することを目指しています。今後も、ジェネレーティブAI技術の普及をサポートするために、AIインフラへの投資を続けてまいります。」
アリババクラウドはまた、独自のフラッグシップモデル「Qwen-Max」のアップグレードを発表しました。強化されたQwen-Maxモデルは、言語理解や推論、数学、コーディングといった分野で高い性能を発揮します。
マルチモーダル領域の拡大
アリババクラウドは、大規模言語モデルの広範囲のスイートに加え、画像生成モデル「通義万相(Tongyi Wanxiang)」ファミリーの一部として、新しいテキストからビデオへのモデルも発表しました。このモデルは、リアルなシーンから3Dアニメーションまで、様々なビジュアルスタイルの高品質なビデオを生成することが可能です。中国語や英語のテキスト指示に基づいてビデオを生成し、静止画像を動画に変換することもできます。このモデルは、高度なディフュージョントランスフォーマー(DiT)アーキテクチャーを採用しており、ビデオの再構築品質を向上させます。
アリババクラウドはまた、視覚と言語を統合したモデル「Qwen2-VL」を発表し、ビジョン言語モデルに大幅なアップデートを加えました。「Qwen2-VL」は、20分以上のビデオを理解し、動画ベースの質問応答をサポートする機能を備えています。このモデルは高度な推論と意思決定能力を備えており、スマートフォン、自動車、ロボットに統合され、特定の操作の自動化を容易にするように設計されています。
さらに、アリババクラウドはプログラミング分野向けに、Qwenを活用したAIアシスタント「AI Developer」を発表しました。このAIアシスタントは、要件分析、コード作成、ソフトウェアバグの特定と修正などのタスクの自動化を支援します。これにより、開発者はより重要な業務に集中し、スキルを向上させることができます。
フルスタックAIインフラのアップグレード
アリババクラウドは、グリーン・データセンター・アーキテクチャー、データ管理、モデルのトレーニングと推論に関する革新的なアップデートを発表しました。
- 次世代データセンター・アーキテクチャーの導入:世界的にAIの開発が進む中で、高性能コンピューティングに対する需要の急増と多様化に対応するため、アリババクラウドは次世代データセンター「CUBE DC 5.0」を発表しました。この新しいアーキテクチャーは、風力と液体を使ったハイブリッド冷却システムや、直流配電アーキテクチャー、スマート管理システムといった最新技術を駆使し、エネルギー効率と運用効率を向上させるとともに、プレハブモジュール設計により従来のデータセンター構築に比べて導入時間を最大50%短縮します。
- データ活用を最大化するオープンレイクソリューション:生成AIの需要が高まる中、企業がAIアプリケーションに必要な膨大なデータを効率よく管理できるよう、アリババクラウドは「Alibaba Cloud Open Lake」を発表しました。このソリューションは、ビッグデータエンジンをシームレスに統合し、ワークフローやパフォーマンスの最適化、堅牢なデータガバナンスを一元化します。これにより、コンピューティングストレージの分離、明確なデータガバナンス、コストと時間の大幅な削減を通じて、リソースの効率的な使用を実現します。
- AIスケジューラでの効率的なリソース管理:アリババクラウドは、クラウド上でのモデルのトレーニングと推論を一元的に管理する「PAI AI Scheduler」を発表しました。これは、コンピューティングリソース管理を強化するために設計された独自のクラウドネイティブなスケジューリングエンジンです。多様なコンピューティングリソースの効率的な統合、柔軟なリリーススケジューリング、タスクのリアルタイム調整、自動障害復旧を活用することで、90%以上の効果的なコンピュート利用率を達成することが可能です。
- メタデータ管理の効率化:アリババクラウドは、組織がデータを効率よく管理し、最大限に活用できるよう「DMS OneMeta+OneOps」を発表しました。このプラットフォームは、複数のクラウド環境にまたがるデータベース、データウェアハウス、データレイクの40種類以上のデータソースを一元的に管理し、データの利用率を10倍に引き上げ、データを価値ある情報に変換する効率を大幅に向上させます。
- 強化されたElastic Computeサービス:アリババクラウドは、最新の第9世代Enterprise Elastic Compute Service(ECS)インスタンスも発表しました。この最新のECSインスタンスは、前世代と比較して、検索やレコメンデーション速度を30%向上させ、データベース製品におけるQPS(Queries Per Second)の読み書き効率を17%改善するなど、性能が大幅に向上しています。
これらのアップデートは、より効率的で持続可能かつ包括的なAIアプリケーションを構築するために、最新のテクノロジーが提供する利点を最大限に活用できるよう、お客様やパートナーの皆様に対してより包括的なサポートを提供することを目的としています。
引用