見出し画像

著作権に配慮した画像生成AI開発用データ約1000万個を無償公開

こんにちは、AI Picasso社の開発チームです。今回は、主にAI開発者の方に役立つお知らせがあります。著作権に配慮した画像生成AI開発用データ約1000万個を無償公開します。一つはCC-0相当の画像データセットに対する説明文データセット「megalith-10m-florence2」、もう一つはCC-0だけで構成されたテキスト画像データセット「soa-full-florence2」です。
「megalith-10m-florence2」と「soa-full-florence2」 はそれぞれ以下のURLにてダウンロードすることができます。

開発用データ公開の背景

AI Picasso社では、クリエイターの皆様との積極的な対話を通じて、相互理解と協力のもとにAI技術を開発しています。私たちはクリエイターの皆様が直面する課題を解決し、共に成長することを目指しています。その課題の中で、画像生成を使ってみたいが使えないクリエイターやファンの方がいる課題があると考えています。これは画像に対する学習許可を得ていないためでしょう。
そこで、我々は画像に対する学習許可をあらかじめ提示しているCreative Commonsの画像を利用した日英画像生成モデルCommonArtを開発しております。参考として、現在の生成状況をお伝えします。

「夕暮れの海岸」を意味する英語のプロンプトとCommonArtで生成された画像

このCommonArtの開発過程で「megalith-10m-florence2」と「soa-full-florence2」が作られました。もともとこの2つのデータセットのもととなったデータセットには説明文がありませんでした。そこで説明文を付けることで使いやすくしました。
この2つのデータセットはともに著作権の問題に配慮しており、公益性があります。したがって、この2つのデータセットをぜひみなさまの研究や開発に役立ててほしいと思い、公開した次第であります。

megalith-10m-florence2の概要

「megalith-10m-florence2」はmadebyollin氏が作成したCC-0相当の写真画像を集めた画像リンク集「Megalith-10M」に各画像の説明文(キャプション)をつけたデータセットです。「Megalith-10M」には約1000万枚の画像リンクがまとめられています。「Megalith-10M」は入念な下処理が施されており、機械学習に利用する分には著作権を侵害することはないと思われます。

「megalith-10m-florence2」のキャプションづけにはFlorence-2というモデルが使われています。Florence-2はMicrosoft社が作ったマルチモーダルモデルです。画像に対して効率的にキャプションをつけることができます。また、ライセンス上、画像に付けたキャプションには特に制限はありません。したがって、GPT-4Vとの競合などライセンスのことを気にせずに安心してお使いいただけます。テキストからの画像生成の開発や視覚言語モデルの開発などにお使いください。

soa-full-florence2の概要

「soa-full-florence2」は、スミソニアン協会が公開している情報をもとにmadebyollin氏が作成したCC-0の絵画などを集めた画像リンク集「soa-full」に基づいて作られたデータセットです。「soa-full」には約300万枚の画像リンクがまとめられています。「soa-full-florence2」は開発者のみなさまが使いやすいようにテキストと画像がセットになって公開されています。著作権が切れた画像だけで構成されているため、機械学習に利用しても著作権を侵害することはありません。

「soa-full-florece2」のキャプションづけにはFlorence-2というモデルが使われています。したがって、「megalith-10m-florence2」と同様の理由で安心してお使いいただけます。教育や練習などにお使いください。

まとめ

CommonArtの開発過程で作られた「megalith-10m-florence2」と「soa-full-florence2」はみなさまのお役に立てると期待しております。今後も皆様からのフィードバックを活かしながら、より良いサービス提供を目指します。質問や懸念があれば、どうぞ以下連絡先にお知らせください。

support@aipicasso.app

AI Picasso株式会社では、画像生成AIをはじめとするAI開発に関するご相談を承っております。どうぞお気軽にお問い合わせください。


この記事が気に入ったらサポートをしてみませんか?