Data-centric AI開発に必要なデータ収集・生成からアノテーション、モデル開発、MLOps構築までの全工程を支援するFastLabel株式会社(本社:東京都渋谷区、代表取締役:鈴木健史、以下「当社」)は、AI開発用途に被写体から利用承諾を得ている権利クリアかつAI倫理を遵守する「公平性尊重型人物データセット」 約43,000画像の販売を開始したことをお知らせします。
■データセット販売開始の背景
当社は、2020年1月の創業以来、教師データ作成代行やアノテーションツールの提供を主力事業として展開。現在ではData-centric AI開発全体を包括的に支援するサービス(業務代行およびコンサルティング)およびシステム(各種ツール)を提供しています。これまで、大手企業を中心とした数百社の支援をする中で、AI開発プロセスにおける「データ収集」に関する課題が多く寄せられてきました。
米OpenAI社の「GPT-4」他、大規模言語モデルが公開されたことを受け、コンテンツを生成することが可能な生成AI(Generative AI)技術が急速に発展しています。併せて、英Stability AI社の「Stable Diffusion」に代表される画像に関する生成AIも登場し、活用の可能性が期待されると同時にAI倫理の観点から、被写体からAI開発への利用承諾を得ていることがAIに使用するデータとしての利用条件となるケースが増えています。
上述を背景として、大手企業を中心に既存のデータセットの権利の透明性を見直す動きが進んでいますが、AI開発に必要となる多量のデータを権利クリアに収集することは容易ではありません。そこで、AI倫理を遵守しながら、AI開発の高速化も実現できる短納期でのデータ提供を可能とするため、今回の権利クリアな公平性尊重型人物データセットの販売に至りました。
■当社が販売するデータセットの特徴
当社が販売するデータセットの特徴は以下の3点です。
-
権利クリアであること
当社の販売するデータセットは、データ取得およびAI開発への利用に関する同意書を「すべての被写体」から取得しています。 -
データの利用用途に合わせて、データを加工したうえで納品が可能であること
これまで当社が支援してきた実績とAI開発への深い知見を活かし、利用用途に合わせたトリミング処理や印象分類、アノテーション等のオプションも提案可能です。 -
各業界の実際の開発要件に沿って収集しているデータであること
販売しているデータセットは、AI開発を行っているお客様のご要望に沿って収集したデータであるため、実際のAI開発に活用しやすい撮影要件となっています。
■公平性尊重型人物データセットの内容
本データセットの特徴は、総務省が定めた「AI開発ガイドライン及びAI利活用ガイドライン」の「尊重するべき価値」にも言及のある「公平性」を尊重した内容となっている点です。
アフリカ系・中東系・欧米系・東南アジア系・南米系のモデルに対して、データ取得およびAI開発への利用に関する同意を得た上うえで、屋内外・個人/集団・装飾品の有無等の様々なパターンで撮影を行ったデータセットとなります。
【データセットの詳細】
キャスト:
・人数:計250名
・性別:男女
・年代:10代〜70歳代
・国籍:アフリカ・スリランカ・インド・中東系・欧米系・オーストラリア・中国・東南アジア系・南米系
撮影条件:
・撮影場所:屋内・屋外
・内容:装飾品の有り無し、被写体集団・個人など、さまざまなパターンで撮影された約43000画像
・サイズ:1920px*1080px
・データ形式:jpg
・ファイルサイズ:1画像あたり20~30MB
■データセットの購入およびサンプル画像の確認方法
ご購入またはお見積り、サンプル画像の確認や新規撮り下ろしをご希望のお客様は、以下のメールアドレス宛、もしくはフォームよりお問い合わせください。
今回販売を開始するデータセットにご希望の要件のデータがない場合は、ご要件に応じた新規撮り下ろし対応も可能です。
お問い合わせ:
pr@fastlabel.ai
お問い合わせフォームURL:
https://fastlabel.ai/dataset-lp-press
■当社のデータセット事業について
当社は、データセットの販売のみならず、以下に対応したデータ収集代行サービスを展開しています。
画像(人物撮り下ろし、帳票データ収集 他)
動画(スポーツ動画撮影、走行車両撮影 他)
音声(スクリプト発話、ノイズ収音 他)
テキスト(会話コーパス 他)* LLM開発用途含む
【データ収集代行サービスの取り組み事例】
・ソニーネットワークコミュニケーションズ株式会社:
https://fastlabel.ai/casestudy/snc
・AWL株式会社:
https://fastlabel.ai/casestudy/awl
■今後の展望
当社は、権利クリアなデータを幅広い業種・業界のAI開発現場へスピーディーに提供するため、さらなるデータセットの拡充を進めていきます。また、システムと業務の両面からAI開発プロセスを効率化し、AI開発に取り組む企業、研究機関のインフラとなることで、日本社会におけるAI革命を下支えしていきたいと考えています。
FastLabel株式会社について
当社は、“AIインフラを創造し、日本を再び「世界レベル」へ”をパーパスに掲げ、2020年1月の創業以来、教師データ作成代行やアノテーションツールの提供を主力事業として展開してきました。
現在では、AI開発に必要な学習データ素材の収集、アノテーション、モデル開発、MLOps構築までの全工程をサポートする事業を展開しています。
AI開発においてお困りごとがあれば、以下のメールアドレス宛、もしくはURL先からお気軽にお問い合わせください。
お問い合わせ:pr@fastlabel.ai
お問い合わせフォームURL:
https://fastlabel.ai/contact-pr
社名:FastLabel株式会社
代表者:代表取締役CEO 鈴木健史
事業内容:AI開発を包括的に支援する「AIPaaS」(※)の提供(AIデータプラットフォーム、アノテーションサービス)
設立:2020年1月23日
本社所在地:〒151-0051 東京都渋谷区千駄ヶ谷五丁目27番5号
URL:
https://fastlabel.ai/
※)AIPaaS…AI Process as a Service、AI開発プロセスを高速化・高度化させるサービス、プロダクトの総称