ServiceNow、Hugging Face、NVIDIA、開発者がエンタープライズアプリケーションの構築に生成 AI を活用するための新しいオープンアクセス LLM をリリース

2024年3月4日

StarCoder2 – BigCode コミュニティと 600 以上のプログラミング言語のトレーニングを経て誕生。コード生成、透明性、ガバナンス、イノベーションを推進

カリフォルニア州サンタクララ – 2024 年 2 月 28 日 – ServiceNow (NYSE: NOW)、Hugging Face、および NVIDIA は本日、パフォーマンス、透明性、およびコスト効率の新たな基準を設定するコード生成用のオープンアクセス大規模言語モデルファミリーである StarCoder2 のリリースを発表しました。

StarCoder2 は、誰もが働きやすい世界を実現するデジタルワークフローのリーディングカンパニーである ServiceNow（https://www.servicenow.com/jp/）が運営する BigCode コミュニティと、機械学習コミュニティがモデル、データセット、アプリケーションで共同作業を行う最も利用されているオープンソースプラットフォームである Hugging Face（http://www.huggingface.co/）とのパートナーシップにより開発されました。

619 種類のプログラミング言語にてトレーニングされた StarCoder2 は、アプリケーションのソースコード生成、ワークフロー生成、テキスト要約などの特殊なタスクを実行するために、さらにトレーニングを行うことや、エンタープライズアプリケーションに組み込むことができます。開発者は、コード補完、高度なコード要約、コードスニペット検索などの機能を使用して、イノベーションを加速し、生産性を向上させることができます。

StarCoder2 には 3 つのモデルサイズがあります。1 つは、ServiceNow によってトレーニングされた 30 億パラメータのモデル、2 つ目は Hugging Face によってトレーニングされた 70 億パラメータのモデルです。そして、NVIDIA により NVIDIA NeMo™（https://www.nvidia.com/ja-jp/ai-data-science/generative-ai/nemo-framework/）を使用して構築され、NVIDIA アクセラレーテッドインフラストラクチャ上でトレーニングされた 150 億パラメータのモデルです。より小さなバリエーションは、推論時に必要となる計算量がより少ないパラメータであるため、計算コストを節約しながら強力なパフォーマンスを提供します。実際、新しい 30 億パラメータモデルは、オリジナルの StarCoder 150 億パラメータモデルの性能に匹敵します。

ServiceNow の StarCoder2 開発チームのリーダーであり、BigCode の共同リーダーである Harm de Vries 氏は次のように強調しています。「StarCoder2 は、オープンな科学的コラボレーションと倫理的なデータサプライチェーンによる責任ある AI の実践の組み合わせの力を証明するものです。最先端のオープンアクセスモデルは、開発者の生産性を向上させるために、先行する生成 AI のパフォーマンスを改善し、開発者にコード生成 AI の利点への平等なアクセスを提供し、その結果、あらゆる規模の組織がより容易にその完全なビジネスポテンシャルを満たすことを可能にします」

Hugging Face の機械学習エンジニア兼 BigCode の共同リーダーである Leandro von Werra 氏は次のように述べています。「Hugging Face、ServiceNow、NVIDIA が主導する共同作業により、強力なベースモデルのリリースが可能になり、コミュニティはデータとトレーニングの完全な透明性を確保しながら、幅広いアプリケーションをより効率的に構築できるようになりました。StarCoder2 は、オープンソースとオープンサイエンスの可能性を証明するものであり、責任ある AI の民主化を目指しています」

NVIDIA の応用研究担当バイスプレジデントであるジョナサン・コーエン (Jonathan Cohen) は次のように述べています。「あらゆるソフトウェアエコシステムには独自のプログラミング言語が存在するため、コード LLM はどんな業界においても効率性と革新性の飛躍的向上を促進することができます。NVIDIA とServiceNow および Hugging Face との協業は、安全で責任を持って開発されたモデルを導入し、説明可能な生成 AI への幅広いアクセスをサポートし、国際的なコミュニティに利益をもたらします」

StarCoder2 モデル、カスタムアプリケーション開発を強化
StarCoder2 モデルは、最先端のアーキテクチャと、透明性とオープンなガバナンス（https://arxiv.org/abs/2312.03872）を優先する BigCode の厳選されたデータソースを共有し、大規模な責任あるイノベーションを可能にします。

StarCoder2 は、text-to-code や text-to-workflow 機能など、将来の AI 駆動型のコーディングアプリケーションの可能性を広げます。StarCoder2 は、より広範で深いプログラミングトレーニングにより、リポジトリのコンテキストを提供し、正確でコンテキストを考慮した予測を可能にします。これらの進化は、ベテランのソフトウェアエンジニアにも市民開発者にも同様に役立ち、ビジネス価値とデジタルトランスフォーメーションを加速します。

StarCoder2 の基盤は、Stack v1 と比較して 7 倍以上大きい Stack v2（https://huggingface.co/datasets/bigcode/the-stack）と呼ばれる新しいコードデータセットです。高度なデータセットに加えて、新しいトレーニング技術は、モデルがリソースの少ないプログラミング言語 (COBOL など)、数学、プログラムソースコードディスカッションを理解するのに役立ちます。

ビジネスに特化したデータで機能をファインチューニング

ユーザーは、NVIDIA NeMo や Hugging Face TRL（https://huggingface.co/docs/trl/index）などのオープンソースツールと、業界または組織固有のデータを使用して、オープンアクセスの StarCoder2 モデルをファインチューニングすることができます。より複雑な要約や分類タスクを処理する高度なチャットボットの作成をはじめ、プログラミングタスクを迅速かつ簡単に完了できるパーソナライズされたコーディングアシスタントの開発、関連するコードスニペットの取得、テキストからワークフローへの機能の有効化などを行うことができます。

組織はすでに、基礎となる StarCoder モデルをファインチューニングして、各自のビジネスに特化したタスク固有の機能を作り始めています。

ServiceNow の text-to-code Now LLM は、150 億パラメータを持つ StarCoder LLM の特殊なバージョン上に構築され、同社のワークフローのパターン、ユースケース、プロセスに合わせてファインチューニングされ、トレーニングされています。Hugging Face は、StarChat アシスタントの作成にもこのモデルを使用しています。

AI におけるオープンな科学的コラボレーションを促進する BigCode
BigCode は、Hugging Face と ServiceNow が主導するオープンな科学的コラボレーションであり、コードのための LLM の責任ある開発に専念しています。

BigCode コミュニティは、ワーキンググループやタスクフォースを通じて StarCoder2 プロジェクトの技術的側面に積極的に参加し、30 億パラメータモデルのトレーニングには ServiceNowの Fast LLM フレームワークを、70 億パラメータモデルのトレーニングには Hugging Face の nanotron フレームワークを、150 億パラメータモデルのトレーニングと最適化には NVIDIA NeMo クラウドネイティブフレームワークと NVIDIA TensorRT-LLM（https://developer.nvidia.com/blog/nvidia-tensorrt-llm-supercharges-large-language-model-inference-on-nvidia-h100-gpus/）ソフトウェアを活用しました。

責任あるイノベーションの育成は、BigCode の目的の中核であり、オープンなガバナンス、透明なサプライチェーン、オープンソースソフトウェアの使用、開発者がトレーニングからデータをオプトアウトする機能を通じて実証されています。StarCoder2 は、Inria（https://www.inria.fr/en）によってホストされている Software Heritage（https://www.softwareheritage.org/2024/02/28/responsible-ai-with-starcoder2/）のデジタルコモンズからのライセンスに基づき、責任を持って提供されたデータを使用して構築されました。

Software Heritage のディレクターである Roberto Di Cosmo 氏は次のように述べています。「StarCoder2 は、Software Heritage のソースコードアーカイブを使用して開発された最初のコード生成 AI モデルであり、コード用モデルの責任ある開発という私たちのポリシーに沿うように構築されています。ServiceNow、Hugging Face、NVIDIA の協業は、倫理的な AI 開発へのコミットメントを共有し、より大きな善のためにテクノロジを発展させることを例証しています」

StarCoder2 は、前モデルと同様に BigCode Open RAIL-M ライセンスで提供され、ロイヤリティフリーのアクセスと使用が可能です。さらに透明性とコラボレーションを促進するため、モデルのサポートコードは引き続き BigCode プロジェクトの GitHub ページに掲載されます。

すべての StarCoder2 モデルは Hugging Face からもダウンロード可能で、StarCoder2 150 億パラメータモデルは、開発者がブラウザから直接、または API エンドポイントを通じて実験でき、NVIDIA AI Foundation モデル（https://catalog.ngc.nvidia.com/orgs/nvidia/teams/ai-foundation/models/starcoder2-15b）にて利用可能です。

StarCoder2 の詳細についてはこちらをご参照ください https://huggingface.co/bigcode

※本発表資料は米国時間 2024年 2 月 28 日に発表されたプレスリリースの抄訳です。

NVIDIAについて

1993年の創業以来、NVIDIA（https://www.nvidia.com/ja-jp/） (NASDAQ: NVDA) はアクセラレーテッドコンピューティングのパイオニアです。同社が 1999 年に発明した GPU は、PC ゲーム市場の成長を促進し、コンピューターグラフィックスを再定義して、現代の AI の時代に火をつけながら、各種産業のデジタル化を後押ししています。NVIDIA は現在、業界を再形成しているデータセンター規模の製品を提供するフルスタックコンピューティング企業です。詳細は、こちらのリンクから：https://nvidianews.nvidia.com/

ServiceNowについて

ServiceNow（NYSE：NOW）は、人にしかできない、付加価値の高い新しい仕事を創造します。当社のクラウド型プラットフォームとソリューションは、組織のデジタル化と統合を推進し、よりスマートで、迅速かつ優れたワークフローの構築を支援します。その結果として、従業員はお客様とのつながりを深め、革新性とアジリティを高めることができ、誰もが描く将来のあり方を実現することができます。詳細はこちらをご参照ください http://www.servicenow.com/jp/

Hugging Face について

Hugging Face は、ユーザーが機械学習モデルやデータセットを構築、探索、展開、訓練できるツールを提供する、オープンソースでコミュニティ主導の主要なAIプラットフォームです。詳細はこちらをご参照ください http://www.huggingface.co/

引用