見出し画像

AIのデータってどうやって集めるの?

おはようございます。
大学生よりも大学に通う男、きゃたです。
#図書館が勉強場所




先日新しいアプリの企画の話をさせていただきましたが、そういえばAIのデータ集めをやったことある人ってほとんどいないだろうなーと気づきました。




かなり泥臭くて表に出ることがないことだからこそ、ちょっと面白いんじゃないかなと思いお話ししてみます。



今回作るのは『物体認識』。

よくイオンモールとかに行くと、人が四角で囲まれて感知してるやつありますよね?
#こんなの↓

画像3
https://www.google.co.jp/amp/cedro3.com/ai/yolov3-prediction/amp/

これを自分でデータを集めてやっちゃおうというお話です。


今回は試しに手書きの『木』という漢字を感知したい。
(画像の中に手書き漢字の「木」があれば四角で囲いたい)

そのためのデータ集めの手順は
①データ集め
これはシンプル。
ひたすら『木』って書いて写真に撮るだけ。


②ラベリング
AIに『写真の中のここが木だよ』って教えてあげる作業。
写真に撮った『木』をひたすら四角で囲っていきます。





このデータ集めとラベリングを頑張るのが物体認識のAIを作るための作業。
今回はお試しということで50個くらいの画像を用意してみました。

高性能なAIを作ろうとすると、この作業を何万枚、下手したら何百万枚も行うのです。
#僕はやだ



どうでしょう?AIって意外と泥臭いでしょ?笑

何事も地道な作業が大切なんですね。


それではみなさんよい一日を。

きゃた


『そもそもどこに旅行に行けばいいの?』
そんなお悩みを解決するアプリを作りました。
よかったらインストールお願いします!






この記事が参加している募集

アプリのAndroid版開発のためによろしければカンパをお願いします!!