ナレッジグラフで構造化した膨大な企業データから生成AIの高信頼な出力を実現
当社は、企業における生成AIの活用促進に向けて、多様かつ変化する企業ニーズに柔軟に対応し、企業が持つ膨大なデータや法令への準拠を容易に実現するエンタープライズ生成AIフレームワークを開発し、2024年7月よりAIサービス「Fujitsu Kozuchi」のラインナップとして順次提供を開始します。
近年、汎用の対話型LLMだけでなく、様々な特化型生成AIモデルが開発されていますが、特に企業においては、企業で必要とされる大規模データの取り扱いが困難、生成AIがコストや応答速度をはじめとする多様な要件を満たせない、企業規則や法令への準拠が求められることなどが、業務活用における障壁になっています。
当社は、これらの課題を解決する企業向けの特化型生成AIを強化するため、企業が保有する大規模データの関係性をナレッジグラフで紐づけて生成AIへの入力データを高度化するナレッジグラフ拡張RAGと、入力タスクに応じて複数の特化型生成AIモデルから最も高い性能が出るモデルを選択あるいは複数組み合わせて自動生成する生成AI混合技術、法令や企業規則に準拠した説明可能な出力を行う世界初の生成AI監査技術で構成するエンタープライズ生成AIフレームワークを開発しました。
エンタープライズ生成AIフレームワークの全体像
【エンタープライズ生成AIフレームワークを構成する技術について】
1. 大規模データを正確に参照できない生成AIの弱点を克服するナレッジグラフ拡張RAG
生成AIに関連文書を参照させるための既存のRAG技術(注1)では、大規模データを正確に参照できない課題があります。当社はこの課題を解決するため、既存のRAG技術を発展させ、企業規則や法令、企業が持つマニュアル、映像などの膨大なデータを構造化するナレッジグラフを自動作成することで、従来は数十万、数百万トークン規模だったLLMが参照できるデータ量を1,000万トークン以上の規模に拡大できるナレッジグラフ拡張RAGを開発しました。これにより、ナレッジグラフから関係性を踏まえた知識を生成AIに正確に与えることができ、論理推論や出力根拠を示すことが可能です。
当社は、入力データの取捨選択や保持の方法などナレッジグラフに関する長年の技術蓄積があり、ナレッジグラフを動的に生成・利用するLLMを開発することで、マルチホップQAベンチマーク(注2)で世界最高精度を達成(注3)しました。
2. 企業の多様なニーズに対応する特化型生成AIモデルを自動生成できる生成AI混合技術
生成AIに入力したタスクに対し、最適な特化型の生成AIや機械学習モデルを自動生成する技術や、意思決定に関わる最適化を対話的に行う技術などの既存の機械学習モデルなどを部品のように組み合わせ、プロンプトエンジニアリングやファインチューニングなどを行うことなく、自社の業務に適応したAIモデルを容易かつ迅速に生成できる当社独自の生成AI混合技術を開発しました。各AIモデルの向き不向きを予測し最も性能が高いものを自動的に選択・生成することにより、企業のニーズを満たす高性能な特化型生成AIを数時間から数日程度で素早く生成することが可能です。入力に応じて最適なモデルを組み合わせて特性を最大限に引き出すことができる技術により、小中規模(注4)かつ軽量なモデルを採用でき、電力と計算資源の消費を抑制し、AIの持続的な発展につながることが期待できます。
本技術を用いて、日本語特化型生成AIであるスーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」と、公開されている日本語特化型LLMなどの中から、入力に適したモデルを自動的に混合して回答を出力した結果、日本語性能を測定する標準的なベンチマークであるMTBench(注5)の平均スコアにおいて、公開されている既存の小中規模の日本語特化型モデルと比較して、最高レベルの精度(注6)を達成しました。
3. 企業や法令などの規則に準拠した生成AIを実現する世界初の生成AI監査技術
生成AI監査技術は、生成AIの回答が企業規則や法令などに準拠しているかどうかを監査する世界初の技術です。この監査技術は、生成AIの内部動作状態の解析から回答の根拠を抽出し提示する生成AI説明性技術と、回答とその根拠の間の整合性を検証し矛盾点をわかりやすく提示するハルシネーション判定技術で構成されます。どちらの技術も、テキストだけでなくナレッジグラフと画像といったマルチモーダルな入力データを対象にすることができるため、ナレッジグラフ拡張RAGと組み合わせてより高信頼な生成AIの活用を実現できます。
本監査技術を交通画像から道路交通法違反の状況を検出するタスクに適用した結果、回答根拠として生成AIが入力された交通画像と道路交通法ナレッジグラフのどこに注目して回答したかを示すことに成功しました。
当社は、エンタープライズ生成AIフレームワークを活用した実証実験を行っており、契約書順守チェック30%の工数削減や、サポートデスクの作業効率の25%向上、運輸業におけるドライバー最適配置の計画策定時間の95%削減などの効果を見込んでいます。また、様々な業務への生成AI活用上の課題を解決し、約1,000万文字からなる製品マニュアルからのQA作成、モバイルネットワークの接続障害の解析、3か月間もの監視カメラ映像解析による作業現場の従業員の疲労度解析、大規模ゲノムデータの解析などへの生成AIの適用を実現し、生産性を向上できることなどを確認しています。
【今後について】
当社は今後も、日本語やコード生成といった多種多様なエンタープライズ向けの特化型生成AIモデルを順次ラインナップに追加し拡充していきます。また、経済産業省が推進する国内の生成AIの開発力を強化するためのプロジェクト「GENIAC」に、当社が提案したナレッジグラフの生成・活用に特化したLLM開発事業が採択されており、その中で軽量なナレッジグラフ生成LLMを開発することにより、今回開発したナレッジグラフ拡張RAGがセキュアなオンプレミス環境でも利用可能になります。
お客様の多様なニーズに対応し、専門業務領域の課題を解決する研究技術の開発を進め、企業における生成AIの活用を強力に支援していきます。
【商標について】
記載されている製品名などの固有名詞は、各社の商標または登録商標です。
【注釈】
注1
RAG技術:
Retrieval Augmented Generation。生成AIの能力を外部データソースと組み合わせて拡張する技術。
注2
マルチホップQAベンチマーク:
HotpotQA(https://hotpotqa.github.io/)。生成AIにおける複雑な質問応答用のベンチマーク。
注3
世界最高精度を達成:
HotpotQAによるベンチマークで他の最新手法に対し約2.4%向上できることを確認。AI分野で世界最高峰の国際会議「ACL 2024」に採択(2024年8月発表予定)。
注4
小中規模:
生成AIのモデルのうち、パラメータ数が13億個から130億個程度のもの。
注5
MTBench:
ある程度の文章量があり、文章で答える必要がある複雑な問題で、回答の正確さを数値化するベンチマーク。
注6
最高レベルの精度:
日本語のMTBenchにおいて、モデルが公開されている既存の中規模の日本語特化型モデルであるMixtral 8x7Bモデルと比較して2.9%優れている成果(7.138から7.353に向上)を獲得。
【関連リンク】
・Fujitsu Kozuchi
(https://www.fujitsu.com/jp/services/kozuchi/)
【当社のSDGsへの貢献について】
2015年に国連で採択された持続可能な開発目標(Sustainable Development Goals:SDGs)は、世界全体が2030年までに達成すべき共通の目標です。当社のパーパス(存在意義)である「イノベーションによって社会に信頼をもたらし、世界をより持続可能にしていくこと」は、SDGsへの貢献を約束するものです。
本件が貢献を目指す主なSDGs
【本件に関するお問い合わせ】
富士通コンタクトライン(総合窓口)
0120-933-200(通話無料)
受付時間: 9時~12時および13時~17時30分(土曜日・日曜日・祝日・富士通指定の休業日を除く)お問い合わせフォーム(https://contactline.jp.fujitsu.com/customform/csque04802/873532/)
プレスリリースに記載された製品の価格、仕様、サービス内容などは発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。
引用