【国産生成AI】経済産業省、AI開発プロジェクト「GENIAC」に採択された10社の先進的取り組みを紹介

ChatGPT

今回は経済産業省の国内の生成AIの開発を向上したプロジェクト「GENIAC」に採択された研究機関・企業10社の取り組みについて紹介しようと思います。
この中からOpenAIに並ぶような企業やサービスが出てくればと思います。
では早速紹介していきます。

「GENIAC」に採択されたプロジェクト10選

日本語大規模基盤モデル開発と半自動データ作成フレームの構築

株式会社ELYZAは、日本語処理能力の高い基盤モデルを開発しています。
Mixture of Experts(MoE)や日本特有のデータ学習により、推論効率と回答精度の向上を目指しています。
このモデルは、自社プロダクトへの組み込みやAPI提供を通じて社会実装され、一部成果物も公開されます。
ポスト5G情報通信システムの開発の一環として、評価データセットの整備やコミュニティへの貢献も行われます。

End-to-End音声基盤モデルの開発

株式会社Kotoba Technologies Japanは、End-to-Endで音声を入出力できる基盤モデルを構築しています。大規模音声データセットを用いて学習し、評価パイプラインを整備。学習ノウハウや一部学習済みモデルを公開し、国内でのビジネス展開を進めています。また、開発した音声基盤モデルをAPIとして商用提供し、商用パッケージングも行う予定です。

論理推論を可能とする大規模言語モデルの研究開発

富士通株式会社は、法務・金融・医療など規制規則が必要な業界でも生成AIを利用可能にするため、ナレッジグラフの生成と推論に特化した大規模言語モデルを開発しています。
ナレッジグラフ生成LLMとナレッジグラフ推論LLMの2つのモデルを構築し、自社ビジネスへの展開を図っています。
得られた成果物の一部は、Hugging FaceやGitHubで公開予定です。開発ノウハウやモデル利用のためのコードも公開し、社会実装を進めます。

LLMの社会実装に向けた特化型モデルの元となる汎化的LLMに関する研究開発

株式会社ABEJAでは、将来的な特定の業種や分野に特化したLLMを作るための元となる汎用性の高いLLMの開発を進めています。
同社は、オープンソースのLLMをベンチマークにして評価し、トップスコアを達成しています。
また、RAG(Retrieval-Augmented Generation)やAgentといった周辺技術の精度を高め、データの活用を推進を自社ビジネスとして展開を目指すほか、関連した成果物を公開・提供することで、外部コミュニティへの貢献を実施する予定です。

自律型エージェントシステム向け高効率基盤モデルの開発

Sakana AI株式会社は、大きな計算リソースを必要とするAI基盤モデルを効率化する技術を開発しています。
同社の目標は、高性能でありながら低コストの小規模AIモデルを開発し、それらのモデルを組み合わせて強力なシステムを構築することです。
社会実装を目指し、国内でのビジネス展開に力を入れており、一部のモデルやノウハウを公開・提供しています。
また、自社ビジネスの展開に加えて、パートナー企業と共同で、特定の産業分野に特化した製品の開発にも取り組んでいます。

オープンかつ日本語に強いGPT-3級大規模言語モデルの構築

国立情報学研究所は、日本語に特化したGPT-3級の大規模言語モデル(LLM)を構築を目指しています。
このモデルは1750億パラメータを有し、商用を含む広範な用途に利用可能な形で公開される予定です。
また、開発過程や議論の内容、そして失敗経験も含めて共有することで、日本の開発力の向上に寄与することを目的としています。
具体的な実施内容としては、大量の日本語データに基づく事前学習、インストラクションデータを用いた追加学習などがあります。
これにより、高い日本語性能を持つモデルの構築を目指しています。

厳密さが要求されるビジネス用途におけるハルシネーションを大幅抑止した基盤モデル

ストックマーク株式会社は、ビジネス用途で問題となるハルシネーション(もっともらしいが誤った情報を生成すること)を大幅に削減した基盤モデルを開発しています。
このモデルは特に、ビジネス領域の質問に対して高い正答率を達成しており、ChatGPTに比べて格段に信頼性が高いとされています。
国内でのビジネス展開を視野に入れ、情報収集・検索SaaSサービスや他社へのPaaS/APIとしての販売を計画しており、開発ノウハウも公開しています。
これにより、実ビジネス環境でのAIの活用をさらに推進しようとしています。

完全自動運転に向けたマルチモーダル基盤モデルの開発

Turing株式会社は、完全自動運転技術に向けて、マルチモーダル(複数の形式を組み合わせた)基盤モデルを開発しています。
このモデルは、言語、画像、映像データを統合し、日本の運転環境に特に強い適応力を持つことを目指しています。開発は主にモデルに焦点を当てており、後の段階で自動車への搭載と改良が行われる予定です。
また、この技術を活用した自動運転機能を有する電気自動車(EV)を国内市場に販売し、開発で得られたソースコードやモデル、ノウハウなどの成果物を公開する計画です。

多様な日本語能力の向上を目指した公開型の基盤モデル開発

東京大学は、民間企業、研究者、学生などが混在する8つのチームにより、小規模で多様な基盤モデルの開発を行っています。
このプロジェクトは、効率的な開発手法を探索するため、技術の黎明期にある基盤モデル開発の試行錯誤に焦点を当てています。
開発過程では100名の開発者が経験を積み、得られた成果物(ソースコード、モデル、ノウハウ)を公開し、日本の開発力を向上させることを目指しています。
最終的には、8チームの知見を結集して、より大規模な50Bサイズのモデルを開発する予定です。

100B/1Tパラメータからなる大規模マルチモーダル基盤モデルの構築

株式会社Preferred Elementsは、100B(1000億)パラメータを持つ言語、画像、音声に対応したマルチモーダルモデルと、1T(1兆)パラメータの言語モデルの開発と検証を行っています。
これらのモデルは日本語のパフォーマンスに優れており、社会実装とビジネス展開に向けて成果物の一部を公開する予定です。
同社はこれらの基盤モデルを活用したAPIやライセンスを国内外で提供し、それに伴うビジネスも展開していく計画です。

あとがき

今回は「GENIAC」プロジェクトに採択された10のプロジェクトを紹介しました。
これらのプロジェクトは、AIの最前線で活動しており、将来的にOpenAIに匹敵するような企業やサービスが日本から生まれると良いですね。
これらの革新的なプロジェクトは、日本のAI分野においてどのような変革をもたらすのか、今後も注目していきたいと思います
また日本企業が開発しているLLMも次の記事で紹介していますので、あわせてご覧頂ければ嬉しいです。

引用

https://www.meti.go.jp/policy/mono_info_service/joho/post5g/240202kaisyagaiyou.pdf https://www.meti.go.jp/policy/mono_info_service/joho/post5g/240517_theme_01.pdf

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

タイトルとURLをコピーしました