サイバーエージェント、DeepSeek-R1の追加学習モデルを公開

サイバーエージェントは2025年1月27日、最新の大規模言語モデル(LLM)である「DeepSeek-R1-Distill-Qwen-32B-Japanese」を公開しました。このモデルは、DeepSeek-R1-Distill-Qwen-14Bおよび32Bをベースに、日本語データを用いて追加学習を行ったものです。

    同社はこのモデルをHugging Face上で公開し、国内外の研究者や開発者が自由に利用できるようにしています。今回の発表は、日本語に特化した自然言語処理技術の発展に向けた重要な一歩として注目されています。サイバーエージェントは、今後もモデル公開や産学連携を通じて、AI技術のさらなる向上を目指していくとのことです。

    「DeepSeek-R1」は、日本語データに基づいた最適化を施しており、高度なテキスト理解や生成能力を備えています。また、産業用途にも対応できるよう設計されており、カスタマイズの柔軟性も高いとされています。公開されたモデルは、研究開発だけでなく、ビジネス用途や教育分野での活用も期待されています。

    モデルの詳細については、Hugging Face上の公開ページをご覧ください。

    引用

    よかったらシェアしてね!
    • URLをコピーしました!
    • URLをコピーしました!

    この記事を書いた人

    AI・DX・LowCodeなど企業に役立つ情報を発信しています。

    目次