〜機密・機微情報を安全に扱え、個別企業の業務に合わせてカスタマイズが可能〜
株式会社野村総合研究所(本社:東京都千代田区、代表取締役会長 兼 社長:此本 臣吾、以下「NRI」)とNRIデジタル株式会社(本社:神奈川県横浜市、代表取締役社長:雨宮 正和、以下「NRIデジタル」)は、生成AIの活用にあたって大きな懸念事項である、「データ漏洩リスク」を極小化する生成AIソリューション「プライベートLLM(大規模言語モデル)」(以下「本ソリューション」)を、2024年春以降に提供する予定です。本ソリューションは、金融機関など、特に高いレベルの情報セキュリティ統制を必要とする企業が利用することを想定しています。
主な特長は、以下の通りです。
機密・機微情報を安全に扱えるよう、プライベートクラウドやオンプレミス環境で動作
生成AIの活用においては、OpenAI社注1のGPT-4注2などに代表される外部サービス型LLMにどこまで機密・機微情報を送信してよいのか、という点が大きな懸念事項となっています。本ソリューションでは、Meta社注3のLlama 2注4を始めとする基盤モデルが公開されたLLMを、NRIのデータセンターで稼働するプライベートクラウドサービスや企業自身が情報システムを保有し運用するオンプレミス環境で動作させることで、機密・機微情報を安全に扱うことを可能にします。金融機関などが求める、高レベルの情報セキュリティ統制にも対応可能です。
個別企業の業務に合わせてLLMをカスタマイズ
Llama 2など基盤モデルが公開されたLLMの性能は、現時点では外部サービス型LLMには及ばないものの、企業が持つデータを利用してカスタマイズ(プリトレーニング注5、ファインチューニング注6など)することで、タスク内容によっては業務に適用可能な水準の性能を発揮することが期待できます(後述の社内実証結果や参考資料を参照)。本ソリューションでは、より機密性が高い学習時点のデータの漏洩リスクも極小化した上で、各社の業務に最も適した形でLLMをカスタマイズします。
「プライベート音声認識」などの周辺モジュールも提供
LLMに音声認識機能を組み合わせると、例えばコンタクトセンターや対面での問い合わせ対応など、適用できる業務の幅が大きく広がるため、個人を特定することが可能な音声データの漏洩リスクを極小化する「プライベート音声認識」モジュールなど、周辺モジュールも提供していきます。
本ソリューションのメニュー体系は、下図を参照してください。
図:「プライベートLLM」ソリューションのメニュー体系
白抜き文字部分をNRIが提供。
GPU:Graphics Processing Unitの略称。LLMを動作させるために必要。
RAG:Retrieval Augment Generationの略称。外部の事実データを参照してLLMに正確に回答させる手法。
NRI社内業務を対象として、性能と効果を確認
本ソリューションの性能を検証するため、NRIにおいて、社内の会計事務手続きサポート業務に適用しました。カスタマイズ用の学習データ6万件を用いて、NRIのデータセンターに設置したGPU上で動作するLlama 2のファインチューニングを行ったところ、業務に適用可能な水準まで性能が向上しました。その結果、本ソリューションによって当該業務の一部を代替し、Q&A作成の作業時間を60%削減できました。
NRIとNRIデジタルは、今後も企業や個人のニーズに合わせて最適化された生成AIを活用できるよう、各種サービスの開発に積極的に取り組んでいきます。
- 文中の社名、サービス名、登録商標および商標は、それぞれの会社に帰属します。
- 注1 OpenAI社:AIの研究、導入を行っている企業。詳細は次のウェブサイトをご参照ください。
https://openai.com/ - 注2 GPT-4:OpenAI社が開発・提供している大規模言語モデルの一つ。
- 注3 Meta社:詳細は次のウェブサイトをご参照ください。
https://about.meta.com/ - 注4 Llama 2:Meta社が開発した大規模言語モデル。基盤モデルを含めて商用利用可能な形で公開されている。
- 注5 プリトレーニング:LLMに汎用的な言語パターンや知識を学習させること。
- 注6 ファインチューニング:LLMを特定のタスクに特化して微調整すること。
ご参考
表1:外部サービス型LLMと本ソリューション「プライベートLLM」の特長比較
表2:カスタマイズによるLlama 2の性能向上見通し
引用