【日本のイノベーション】GPTだけじゃない国産LLM 10選

ChatGPT登場以降、劇的に注目を集めている生成AIですが、日本でも独自の言語モデルをベンチャー企業から大企業、アカデミーなど様々な企業や研究機関の取り組みが進んでいます。
今回はそんな日本初の大規模言語モデル(LLM)を10個紹介します。

目次

日本語対応LLM10選

野村総合研究所 「プライベートLLM」

株式会社野村総合研究所(NRI)とNRIデジタルは、2024年春より機密・機微情報の安全性を高めた生成AIソリューション「プライベートLLM」の提供を予定しています。
このソリューションは特に情報セキュリティが重要とされる金融機関などの企業向けで、データ漏洩リスクを最小限に抑えます。

あわせて読みたい
NRIグループ、データ漏洩リスクを極小化した個別企業向け生成AIソリューション「プライベートLLM」を202... 〜機密・機微情報を安全に扱え、個別企業の業務に合わせてカスタマイズが可能〜 株式会社野村総合研究所(本社:東京都千代田区、代表取締役会長 兼 社長:此本 臣吾、...

株式会社Lightblue「Karasu」「Qarasu」

株式会社Lightblue(本社:東京都千代田区、代表取締役:園田亜斗夢)は、自社運営の生成AI研究開発チーム「LLab」を通じて、日本語に特化した大規模言語モデル(LLM)「Karasu」と「Qarasu」を公開しました。
これらは商用利用が可能で、オンプレミス環境での利用も実現可能です。

  • Karasu: 70億パラメータを持ち、Shisaに基づいて開発されたモデルで、日本語と英語の学習データを使用しています。
  • Qarasu: 140億パラメータを持ち、Qwen-14Bに基づいており、既存の日本語公開モデルの中で最高性能を達成しています。
あわせて読みたい
Lightblue、商用利用可能な日本語LLM「Karasu」「Qarasu」を公開 既存の日本語公開モデルの中で最高性能を達成、オンプレミス環境でのLLM利用を実現可能に 生成AIの研究開発「LLab」を運営し、日本語LLMの開発・提供を手掛ける株式会社...

株式会社ELYZA「ELYZA-japanese-Llama-2-13b」

東京大学松尾研究室発のAIカンパニー、株式会社ELYZAは、130億パラメータの日本語LLM「ELYZA-japanese-Llama-2-13b」を開発し、公開しました。
このモデルは、Metaが開発した「Llama 2」に基づき、追加の日本語事前学習とELYZA独自の事後学習を施しています。
このモデルは、175BパラメータのGPT-3.5 (text-davinci-003)を上回る性能を持っています。

あわせて読みたい
【デモあり】ELYZA、商用利用可能な130億パラメータの日本語LLM「ELYZA-japanese-Llama-2-13b」を一般公開 既存のオープンな日本語モデルの中で最高性能、175BのGPT-3.5 (text-davinci-003) を上回る性能を達成  大規模言語モデルの社会実装を進める東京大学松尾研究室発・AI...

Money Forward Lab、理化学研究所 「houou」

株式会社マネーフォワードの研究開発組織であるMoney Forward Labと理化学研究所の言語情報アクセス技術チームは、共同で大規模言語モデル(LLM)の研究を進め、新たなインストラクションデータを使用したLLM「houou-7b」を公開しました。
このモデルは、高い精度の日本語テキスト生成を可能にするために、rinna株式会社の「Youri7B」に基づきインストラクションチューニングを行いました。
さらにMoney Forward Labは、2024年3月までにモデルの継続的なリリースと、経理財務や人事労務領域に特化したインストラクションデータの開発を予定しています。

あわせて読みたい
Money Forward Lab、理化学研究所との共同研究による日本語インストラクションデータで学習された大規模... 株式会社マネーフォワードは、当社の研究開発組織Money Forward Labと、国立研究開発法人理化学研究所革新知能統合研究センター 言語情報アクセス技術チームが共同で取...

株式会社サイバーエージェント 「CyberAgentLM」

株式会社サイバーエージェントは、70億パラメータで32,000トークンに対応する日本語の大規模言語モデル(LLM)を公開しました。
これは、日本語および英語データで事前学習されたベースモデル「CyberAgentLM2-7B」と、チャット形式でチューニングされた「CyberAgentLM2-7B-Chat」の2つのモデルで構成されています。
特に「CyberAgentLM2-7B-Chat」は、約50,000文字相当の長い日本語テキストを一度に処理できる能力を持っています。
サイバーエージェントは、自然言語処理技術の発展に貢献する目的でこれらのモデルを開発し、独自の「極予測AI」サービスを含む様々なアプリケーションに活用しています。

あわせて読みたい
独自の日本語LLM(大規模言語モデル)のバージョン2を一般公開 ―32,000トークン対応の商用利用可能なチ... 株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田晋、東証プライム市場:証券コード4751)は、70億パラメータ・32,000トークン対応の日本語LLM(La...

NEC 「NEC LLM」

NECは、高い性能を持ちながらも、130億パラメータというコンパクトなサイズの日本語LLMを開発しました。
このモデルは、通常のサーバでのGPU1枚搭載環境で動作可能であり、電力消費やサーバコストを抑えることができます。
また、オンプレミス環境での動作も可能で、秘匿性が高い業務に適しています。

あわせて読みたい
NEC、130億パラメータで世界トップクラスの日本語性能を有する軽量なLLMを開発 NECは、Generative AI(生成AI)における日本語大規模言語モデル(Large Language Model、以下LLM)を開発しました。本LLMは独自に収集・加工した多言語データを利用し、NEC...

NTT 「tsuzumi」

NTTは、「tsuzumi」と名付けられた新しい大規模言語モデル(LLM)を開発しました。
このモデルは、70億(7B)と6億(0.6B)のパラメタサイズの2種類を持ち、GPT-3の1750億(175B)と比較して約300分の1および25分の1のサイズです。
この軽量化により、追加学習や推論のコストを大幅に削減します。

あわせて読みたい
NTT版大規模言語モデル「tsuzumi」 NTT版LLMの概要 近年、ChatGPTを始めとする大規模言語モデル*1に大きな注目が集まっておりますが、これらは膨大な知識をモデル内に有することで高い言語処理性能を示す...

LINE 「japanese-large-lm」

LINEのNLP Foundation Devチームが新たな日本語言語モデル「japanese-large-lm」を公開しました。
モデルは、36億(3.6 Billion)および17億(1.7 Billion)のパラメータを持ち、HuggingFace Hubで利用可能です。
このモデルはLINE独自の大規模日本語Webコーパスを使用して訓練され、高品質なデータの活用が強調されています。

あわせて読みたい
LINEは商用利用可能な36億パラメータの日本語言語モデルを公開 LINEのNLP Foundation Devチームが新たな日本語言語モデル「japanese-large-lm」を公開しました。モデルは、36億(3.6 Billion)および17億(1.7 Billion)のパラメータ...

rinna 「Nekomata」

rinna株式会社は、Qwenシリーズに基づいて開発された日本語の継続事前学習モデル「Nekomata」シリーズを公開しました。
このシリーズは、Qwen 7Bと14Bモデルにそれぞれ300億と660億トークンで日本語と英語の学習を行い、高い日本語テキスト生成性能と推論速度を持つモデルです。
また、対話応答言語モデルも開発され、合計4モデルが公開されました。

あわせて読みたい
rinna、Qwenの日本語継続事前学習モデル「Nekomata」シリーズを公開 高い日本語性能と推論効率を兼ね備えたモデルにより運用が現実的に rinna株式会社(本社:東京都渋谷区/代表取締役:ジャン"クリフ"チェン、以下rinna)は、Qwen 7Bと14...

ストックマーク 「Stockmark-13b」

ストックマーク株式会社は、日本語単独で最大規模となる130億パラメータのLLM「Stockmark-13b」を公開しました。
このモデルは、ビジネス用途における信頼性と速度に特化しており、従来の生成AIの問題である「ハルシネーション」を抑制し、高精度で回答が可能です。
また、ChatGPTと比較してテキスト生成速度が約4倍という高速回答が可能で、商用利用が可能なモデルです。

あわせて読みたい
ストックマーク、ビジネスでも信頼できる130億パラメータLLMをオープンソースで公開 業務上で発生する質問に高精度かつ高速で回答可能な「Stockmark-13b」を公開 ストックマーク株式会社(本社:東京都港区、代表取締役CEO:林 達、以下、「当社」)は、...

あとがき

今回は日本発LLM10選をご紹介しました。
どれも独自の特徴を持っている大規模言語モデル(LLM)です。
今後もこういった言語モデルの開発を通じて今後も日本のAI技術発展に期待したいですね。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

目次