【自社でのAI開発に不可欠】権利クリアなLLM用テキストデータセットを1000件販売開始

「権利」「プライバシー」を最大限に保護した、APTO社完全オリジナル「LLM開発用データセット」1000件を販売開始しました。

AI開発でボトルネックになるデータの収集、アノテーションを効率的に行えるプラットフォーム「harBest」を提供している株式会社APTO(本社:東京都渋谷区、代表取締役:高品良)は、LLM(Large Language Model)開発に必要なデータセットを権利クリアな状態で提供開始いたします。

■ LLM開発用データセット提供の背景

2022年にChatGPTがリリースされ、大規模言語モデル(LLM)の開発が加速しています。これらのモデルは、人のように言語を理解し、テキストを生成する能力を持ち、ビジネス、教育、エンターテイメントなど幅広い分野での応用が期待されています。
これらのモデルを効果的にトレーニングするためには、大量かつ高品質で多様なテキストデータセットが不可欠です。2024年2月現在、質の高いデータセットは、より正確で信頼性の高いモデルを生み出す鍵となっており、LLM開発に携わるプレイヤーは各社、高品質なデータセット作成に力を注いでいます。

同様に、企業の皆様がテキストにかかわるAIを自社開発される際に、最もボトルネックになりえるのが、この「高品質なテキストデータ不足」であり「社内の制作リソース不足」です。

いかにしてテクノロジーの進化と社会的な要求に応じた「権利クリアかつ高品質なテキストデータセット」を確保できるが、LLM開発の重要な要素となっています。

■提供するデータセットの特徴

当社が提供するデータセットの特徴は以下です。

①多様性: 当社のデータセットは幅広い業界、トピック、および、言語にわたり、LLMの多様性に対応します。
②権利クリアな保証: すべてのデータは最大限に権利クリアな処理が施され、法的リスクを最小限に抑えます。
③高品質: 提供するデータは高品質で、誤りや不正確な情報を排除するための品質管理プロセスが導入されています。
④カスタマイズ可能: 開発者のニーズに合わせてデータセットをカスタマイズできます。これにより、プロジェクトの独自性を保ちながらトレーニングデータを増やすことが可能です。(別途追加料金)

◼︎LLMデータセットの内容

幅広い分野における質問と回答をセットにして、合計1000件分のデータセットが含まれています。

■データセットの詳細

数量:質問・回答1往復を1件とし、1,000件

ジャンル:一般的な生活に関する分野から教育・政治経済・テクノロジーや金融など、幅広い分野をカバー

記述方式:定義や手段・具体例を提示する回答方法から、与えられた制約内にて回答を生成・選択・算出する回答方法まで、バラエティに富んだ方式でご用意

例文:(ジャンル)生活 (記述方式)計算、文章

Q. いま、職場まで電車とバスで通勤しています。3月まで電車とバスを合わせた片道料金は780円なんですけど、4月から運賃の値上がりにより片道890円となりました。月20日くらい出社するんですけど、月々どれくらい通勤費って増えそうでしょうか?

A:ご質問の内容から、4月以降、月々の通勤費がどのくらい増えそうか計算します。
3月までと4月以降の通勤片道料金差額は120円です。そのため、1日の出勤で往復240円の値上がりと言えます。
20日の出社による値上がりの総額は、これを20倍することで求められます。計算の結果は、合計4,800円です。
よって、月々4,800円ほど通勤費が増えると計算されます。
人件費やエネルギー価格が世界中で高騰する昨今ですが、公共交通機関にもその影響は大きく及んでいるようですね。

■LLMデータセットの購入およびサンプルデータの確認方法

ご購入またはお見積り、サンプルデータをご希望のお客様は、以下のメールアドレス宛にお問い合わせください。
メール:info@apto.co.jp

■カスタマイズデータセットの依頼方法
どういった内容がご希望がお書き添えの上、以下のメールアドレス宛にお問い合わせください。
メール:info@apto.co.jp

当社のwebページからお問い合わせいただくことも可能です。
URL:https://apto.co.jp/contact

■ データセット事業について

当社はデータセット事業を行う上で、以下の三点を重要視しています。

1) プライバシーの保護: 提供するデータセットには、プライバシー保護に対して細心の注意を払っており、法的なリスクを可能な限り回避できるようにします。

2) コンサルティング: AI開発者が最適なデータセットを選択し、開発できるようにデータ使用に関する質問や疑念に対するサポートを提供します。

3) データセットマネジメント: 新たなデータ要件に合わせてデータセットを継続的に更新し、開発者が最新のデータを利用できるようにします。

■ 展望

AI技術は我々の未来において重要な役割を果たすことが期待されています。それに伴って、当社はその未来を共に築いていくためにデータ収集やアノテーション、モデル開発の面で組織の皆様をサポートして参ります。権利クリアなデータセットの提供に限らず、アナログな方法でのデータ収集やあらゆるデータ形式に対応した自動アノテーション機能の開発、また、最新のモデル開発環境を構築することで開発者コミュニティを支援し、AIの進化を促進するサポートをさせていただきます。

■ 本プロダクトに関するお問い合わせ先
https://harbest.io/contact/

【株式会社APTO 会社概要】

社名       :株式会社APTO
所在地    :〒150-0041 東京都渋谷区神南1丁目5番14号 三船ビル4階
代表者    :代表取締役社長 高品 良
設立       :2020年1月20日
事業内容 :AI開発でボトルネックになるデータ作成作業を素早く低コスト・高品質に実施できる「harBest」を提供。
企業URL :https://apto.co.jp/
サービスサイトURL :https://harbest.io/

引用

プレスリリース・ニュースリリース...
【自社でのAI開発に不可欠】権利クリアなLLM用テキストデータセットを1000件販売開始 株式会社APTOのプレスリリース(2024年2月13日 10時00分)【自社でのAI開発に不可欠】権利クリアなLLM用テキストデータセットを1000件販売開始
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

目次