Microsoftは2024年7月2日、高度な質問応答システム「GraphRAG」をGitHubで一般公開したことを発表しました。この技術は、大規模言語モデル(LLM)を活用して非構造化テキストから知識グラフを自動生成し、より包括的で正確な回答を提供します。

GraphRAGの主な特徴
- 構造化された情報検索:従来のRAG(検索拡張生成)手法よりも優れた情報抽出能力を持ち、複雑なクエリにも対応。
- コミュニティ要約機能:データセット全体を俯瞰する「グローバルな質問」に効果的に回答。
- Azure上のソリューションアクセラレータ:数回のクリックでコードフリーのデプロイが可能。
性能評価
Microsoftのテストでは、GraphRAGが包括性、多様性、情報提供力の面で従来のRAG手法を大きく上回りました。特に、データセット全体に関する質問への回答で優れた性能を示しています。
今後の展開
Microsoftは、GraphRAGの初期インデックス作成コストを削減しつつ、応答品質を維持するための研究を進めています。
引用
Microsoft Research


GraphRAG: New tool for complex data discovery now on GitHub
GraphRAG, a graph-based approach to retrieval-augmented generation (RAG) that significantly improves question-answering over private or previously unseen datase...