【週末データサイエンティスト】機械学習のデータセットが何がいいか困ったら、〇〇がおすすめ!!
Aidemyのオンライン講座をきっかけに、機械学習の勉強を始めて4か月。どんどんいろんなことを試したくなる時期です!
加藤昌治さんの考具じゃないですが、
自分の場合の専門の分野とAiを組みあわせて何ができるかな?
とアイディアをねったりしています。
Ai X 診断、Ai X PCR、Ai X Western Blot、Ai X イメージング、Ai X CRISPR....
ありきたりなものから、ちょっとありえないだろうみたいなものまでアイディアが膨らむのですが、
次のステップで大事なのは、プロトタイプを作って本当にそんなことができるのかためすこと!!それには機械学習をさせ、検証するデータセットが必要になっています。
そんなことを考えながら、最近ネットをあさるようになった来たのですが世の中には同じようなことを考えている人がいて、
プロトタイプづくりに必要なデータセットのまとめサイト
なるものがあるのです。
自分はちょっと病気の診断をしてみたくて医学系のデータをあさったのですが。。
Medical Data for Machine Learning
Open-Access Medical Image Repositories
Open Datasets@Skymind
などなどいくつも興味深いサイトが出てきます。
おすすめはKaggleのDatasets
自分が見た中でおすすめなのは競技プログラミングサイトKaggleのDatasets
実際に現場で使っていたデータであるせいか、どれも分析してみたくなるくらい興味深いデータがそろっているんです!!
これはCellでそのdatasetを検索してみたんですが、
Blood Cell Images、Transcriptome in yeast、Chest X-Ray Images
とか楽しそうなデータがいっぱいでいいですね!このあたりから次の機械学習のテーマ探そうかな?って思ったりしています!!
この記事が気に入ったらサポートをしてみませんか?