見出し画像

商用可能な領域抽出CGデータセットを公開しました(vol1:金属塗装キズ)

画像1

損傷箇所検出ができるデータセットが欲しい!

データセットを3時間リサーチして、かわいい犬猫はたくさん見つかったけど、商用利用可で実用っぽいデータセットってあまり出てこず。
なので、自分で金属の塗装キズ・ヨゴレをCGで模したデータセットを作りました

商用利用可能です。商用利用可能にするために、アート系のツールを利用してCGを生成し、それらをデータセットにするアプローチをとりました。
作成方法については、別記事の 「アート系ツールを使って、画像データセットを作る 」で詳細を記載しているので、ご興味ある方はそちらもぜひ。(映像作成ソフトのAdobe After Effectsやテクスチャ生成ソフトのSubstance Designerを使っています)

初めての試みのため、考慮漏れてるところがあると思います。使ったよ!とか何かご意見ご要望あればぜひnoteのコメントか下記の連絡先へどうぞ。
https://www.facebook.com/takahiro.yoshida.94009

データセット詳細

画像5

・枚数 : 500枚
・カテゴリ : scratch ( ひっかき傷 ) / dust ( よごれっぽいの )

画像3

・画像サイズ : 415 x 415
・容量 : 44MB ( さっとダウンロードできる ) 
・形式 : PascalVOC / coco ( coco用のjsonがディレクトリ内にあります ) 
PascalVOCの詳細な解説は下記ブログが詳しいです。

PASCAL VOC③(Datasetの確認)|機械学習の有名データセットや評価指標を確認する
https://lib-arts.hatenablog.com/entry/dataset_ml3

【その他の事項】
強いライトが上か赤い塗装に当たっている状況
・強いライトの照り返しヨゴレ見分けなければいけない

画像4

・光源から離れたヨゴレやキズは見えづらい。

ライセンス

画像4

・本データセットのライセンスは、Attribution 4.0 International (CC BY 4.0) です。
・著作者の名前{© 2020 TakahiroY}と本記事のnoteのURLを必ず明記してください。
・改変する場合は、改変したことがわかるようにしてください。
・再配布の際にライセンスを表記する場所は、コンパイルされるようなソースコード内コメントではなく、そのデータセットを用いるユーザーが見える箇所に明記してください。( README等 )

ダウンロード

https://drive.google.com/file/d/145VAxcISFQW01UJZ_SuV7wXKz6ImQl_7/view?usp=sharing

使い所について

技術検証や説明資料として使っていただければ幸いです。
・自作アルゴリズムの動作テストとして
・動画解説のチュートリアルとして
・ツールのチュートリアルとして
・講座等で説明する資料として
etc...

また、このデータセットには、2つテーマがあります。

1.実データをとる前に簡易シミュレーション
CGで作ったこの画像が実際の業務にそのまま転用できると考えていません。実データで学習する前に、このデータセットを使って学習の難易度や予測速度について簡易的にシミュレーションができたらと思っています。

2.検知漏れをどうフォローする?
2.このデータセットでは、光源から離れたモノは検知しづらくなっています。おそらく検知漏れが発生するはずで、「どうやって検知漏れをフォローしてアルゴリズムを運用していくのか?」など問題が発生します。例えば、「機械のあとに人間が検査をしても、あらかじめいくつか箇所が示されていることで工数が短縮される」等、考えるキッカケになれば幸いです。( いずれこれ系の記事書いてみたい )

さいごに

この記事では、損傷箇所検出ができるデータセットが欲しい!ということで、実際にCGで作ってみました。また、データセットの作成風景である別記事の 「アート系ツールを使って、画像データセットを作る 」では、データサイエンティスト界隈ではあまりなじみのない、アート系ツールの紹介もあるので、ぜひ。




この記事が気に入ったらサポートをしてみませんか?