今回は経済産業省の国内の生成AIの開発を向上したプロジェクト「GENIAC」に採択された研究機関・企業20社の取り組みについて紹介します。
「第2期」GENIACに採択されたプロジェクト20選
ポスト5Gに向けた特化型モデル開発と社会実装の推進
株式会社ABEJAは、ポスト5G情報通信システム基盤強化の一環として、大規模言語モデルの小型化に取り組んでいます。
50B以下および10B以下のパラメータサイズを持つモデルを開発し、特定タスクにおいて高性能を実現。
これにより、ビジネス支援や実運用に適した高性能とコストの両立を目指しています。
また、開発成果物の公開を通じて、コミュニティの活性化に寄与し、社会実装を視野に入れたビジネス展開を推進しています。
汎用性の高い動画生成AIモデルとプラットフォームの構築
株式会社AIdeaLabは、日本語対応の動画生成AI基盤モデルの開発を推進しています。
軽量で汎用的なモデルや、アニメ用の高度な動画生成モデルを開発し、広範な活用が可能なAIプラットフォームを提供します。
このプラットフォームは、自社ビジネス展開やAPIを通じたサービス提供に活用され、社会実装を進めます。
また、公開されたソースコードや開発ノウハウの共有を通じて、技術コミュニティへの貢献も行われます。
生成AI基盤を活用した非定型帳票処理の革新と自律化
AI inside株式会社は、非定型帳票の処理効率を向上させるため、生成AI基盤とLLM-SLMの2段階アーキテクチャを採用しています。
これにより、低コストかつ高精度な処理の実現と、自律化による効率向上を目指します。また、スケーラブルなインフラ構築と分散計算機能の研究開発を進め、さまざまな形態(パブリッククラウド、プライベートクラウド、オンプレミス)で社会実装を行います。
評価データやノウハウも公開され、技術コミュニティへの貢献も期待されています。
製薬業務に特化した日本語LLMの開発と社会実装
株式会社EQUESは、薬学分野および製薬業務に特化した日本語LLM(大規模言語モデル)の開発を推進しています。
製薬業界でのタスク遂行に優れたモデルの開発を目指し、データセット構築やベンチマークの作成を行います。
また、これらの技術を活用したアプリケーションやAIソリューションを提供することで、国内製薬会社を中心に広範な活用が期待されています。
評価データやノウハウは積極的に公開され、技術コミュニティにも貢献します。
リアルタイム音声基盤モデルの開発と日本市場における実用化
株式会社Kotoba Technologies Japanは、日本語および多言語対応のリアルタイム音声基盤モデルの開発を推進しています。
合成音声や音声データを活用し、大規模な高品質データセットを構築することで、音声チャットボットや翻訳ツールなどのアプリケーション向けに最適化されたモデルを提供します。
日本市場に向けた社会実装を目指し、playgroundやエンタープライズの顧客に対しても商業化を進めていく道筋を示します。また、成果物として前処理モデルや開発ノウハウも公開され、技術コミュニティへの貢献も図られています。
食品・流通小売領域に特化したマルチモーダル大規模言語モデルの開発
NABLAS株式会社は、日本特有の食品業界の知識を高精度に扱える大規模視覚言語モデル(LVLM: Large Vision-Language Model)を開発しています。
画像、動画、テキストなど異種データを同時に処理できるモデルを構築し、食品業界へのサービス提供や応用を目指します。
また、成果物として技術報告書やデータセット、開発ノウハウを公開し、食品関連企業への広範な技術提供を進めています。
世界最大規模の高品質データセットを活用した大規模言語モデルの開発
株式会社Preferred Networksおよび株式会社Preferred Elementsは、LLMを活用した世界最大規模の高品質学習データセットの構築と、それを基にした最大30BパラメータのMixture of Experts(MoE)モデルの開発を推進しています。
このプロジェクトでは、データ生成方法や学習時のノウハウを公開し、国内外の企業に対してAPIおよびライセンスの提供を通じた商業展開も行います。
また、研究用途やビジネス展開に向けて、開発されたモデルとノウハウの成果物を広く公開しています。
AI創薬を実現させる分子情報特化基盤モデルの開発
SyntheticGestalt株式会社は、AI創薬に特化した分子情報基盤モデルの開発を行っています。
最大100億件の化合物データを活用し、創薬の課題解決に役立つ機械学習モデルを構築します。
これにより、薬効・副作用予測や創薬過程の支援を目指し、実験データを用いたモデルの評価を行い、成果物として公開します。
また、Google CloudやAWSのMarketplaceを通じて、開発されたモデルの商業展開を進め、グローバルな製薬・材料・化学企業との連携を図ります。
完全自動運転に向けた身体性を持つマルチモーダル基盤モデルの開発
Turing株式会社は、完全自動運転を実現するために、視覚・言語・センサーデータを統合的に処理できる「身体性」を持つマルチモーダル基盤モデルを開発しています。
このモデルは、運転環境における周囲の移動体や環境変化をリアルタイムで予測する能力を備えています。
また、実際の自動運転タスクと連携させることで、高精度な自動運転システムの構築を目指しています。
これにより、カメラやAIを活用した先進運転支援システム(ADAS)の提供が可能となり、広く自動車業界への展開が進められます。
都市時空間理解に向けたマルチモーダル基盤モデルの開発
ウーブン・バイ・トヨタ株式会社は、都市時空間理解に特化したマルチモーダル基盤モデル「City-LLM」の開発を進めています。
このモデルは、映像・画像・言語・センサーデータを活用して、実世界の都市環境における時空間情報を高精度に理解することを目指しています。
Woven Cityでの実環境における検証を含む社会実装や、国際的なAIコンペティションへの参加を通じて、交通安全や人の移動を支援するサービスの提供を目指しています。
成果物としては、ソースコードや開発ノウハウの一部が公開され、広く技術コミュニティへの貢献が行われます。
パーソナルAIの実現を目指した世界最高性能の日本語処理技術の研究
株式会社オルツは、労働力の補完を目的とした日本語LLMの構築を進めています。
本プロジェクトでは、特に金融、保険、IR、社内規定、法律分野におけるRAG(Retrieval-Augmented Generation)性能の向上を目指し、100万件以上のRAG向けデータセットを構築します。
労働力としてのAI活用を意識し、広範な指示に対応するためのInstruction Pre-trainingのデータ構築も行い、業界内での活用を推進します。
成果物としては評価データやノウハウが公開され、ビジネス展開やパートナー企業との連携を通じた社会実装が進められます。
地域気候サービスのための生成AI基盤モデルの開発
国立研究開発法人海洋研究開発機構は、日本国内における地域や企業が効果的な気候変動対策を立案するための特化型生成AIモデルを開発しています。
日本語対応の言語モデルを基盤とし、気象学や気候変動リスクの知識を習得することで、温暖化に伴うリスク予測や対応策の立案を支援します。
このモデルは、企業や自治体が将来の気候リスクに対して適切な対応策を立てるために活用され、TCFDレポート作成や災害対策計画の支援を目的としています。
日本のカスタマーサポートのための高品質AIエージェントモデルの開発
カラクリ株式会社は、日本のカスタマーサポートに特化したAIエージェントモデル(70B相当)とベンチマークの構築を進めています。
このモデルは、カスタマーサポートの知識を学習し、課題に対して適切な解決策を提案する能力を備えています。
開発されたモデルやノウハウは公開され、商業利用や自社サービスとの統合を通じて、日本のカスタマーサポート業界に貢献します。
さらに、成果物はソースコードとして公開され、技術コミュニティへの貢献も図られています。
ハルシネーションを抑止したドキュメント読解基盤モデルの構築
ストックマーク株式会社は、設計書や提案書などの高度なドキュメントを読解できるマルチモーダル基盤モデル(100Bサイズ)の開発を進めています。
このモデルは、文字だけでなく図表や概念図も含む複雑な文書を理解するために設計されており、AIによる情報収集や検索SaaSサービスなどに応用されます。
成果物としては、ソースコードや開発ノウハウが公開され、既存の自社サービスとの統合を通じて国内外での展開を目指しています。
ユーザー意図を反映する選択的編集能力を備えたVision系基盤モデルの開発
株式会社データグリッドは、汎用動画・画像生成モデルに加え、ユーザーの意図を反映した選択的編集機能を持つVision系基盤モデルを開発しています。
また、生成コンテンツの品質を高めるためのディープフェイク検知モデルの構築も行っています。
これらのモデルは、自社プロダクトやAPIプラットフォームを通じて、商業利用やパートナー企業への提供が進められ、技術コミュニティへの貢献として、Hugging FaceやGitHub、テックブログを通じた成果物の公開も予定されています。
創薬を加速する遺伝子発現量の基盤モデル開発
株式会社ヒューマノーム研究所は、創薬の成功率を向上させるため、遺伝子発現量の計測結果を活用した分野特化型基盤モデルを開発しています。
3億パラメータ相当の基盤モデルを構築し、遺伝子発現の予測や細胞状態の評価を行うことで、創薬のプロセスを効率化します。
研究成果として、ソースコードやノウハウが公開され、自社ビジネスの展開としてカスタマイズされたサービスやライセンス提供も行われます。
日本語とソフトウェア開発に特化した基盤モデルの構築
株式会社フューチャーは、日本語とソフトウェア開発に特化した基盤モデルの構築を進めています。
世界最高水準の日本語×ソフトウェア開発モデルを目指し、コードレビューや単体試験、ドキュメント生成など、コーディング以外の周辺タスクにも対応できるモデルを開発中です。
また、このモデルは情報教育への応用も見込まれ、IT人材の育成にも貢献することが期待されています。成果物として評価データやノウハウが公開され、ビジネス展開や教育システムへの導入が進められます。
企業の知の結晶である様々なドキュメント群を読み取るマルチモーダルLLMの開発
株式会社リコーは、企業の知識の継承を支えるため、マニュアルや図表を読み解くマルチモーダルLLMを開発しています。
このモデルは、長文のコンテンツや複雑なドキュメントを適切に理解し、製造現場や企業内での文書管理に応用可能な高解像度かつカスタマイズ性に優れた基盤モデルです。
開発されたノウハウやベンチマークは公開され、広範な社会実装への貢献が期待されています。ビジネス用途としては、API提供やライセンス販売を通じて企業内の文書管理をサポートします。
観光用産業向け405B LLM/基盤モデル開発
株式会社ユビタスおよび株式会社Deepreneurは、東アジア言語(日本語、中国語、韓国語)に強い多言語対応のLLM基盤モデルを開発しています。
Llama3.1 405Bをベースに、観光業向けのアプリケーションを開発・収益化し、観光スポット情報の活用や自治体・カーナビ向けに多言語アプリケーションを提供します。
成果物として、モデルとデータセットが公開され、国内外の観光産業の発展に寄与することが期待されています。
おわりに
今回の記事では、「GENIAC」プロジェクトの第2期に採択された企業や研究機関の取り組みを紹介しました。
AI技術の進化が急速に進む中、各社は様々な分野において独自の生成AI基盤モデルを開発し、社会実装に向けた取り組みを推進しています。
これらのプロジェクトは、日本国内のビジネスや産業を支えるだけでなく、世界に向けた技術的なインパクトを与える可能性を秘めていますね。
引用