見出し画像

OpenSource/データベース:Dataset・学習済みモデル(重み)

 機械学習で使用できるデータセット・学習済みモデルを紹介します。なおオープンソースにはライセンスがありますがMITライセンスであればほぼ自由に使用が可能です。


1.有名・一般的データ

THE MNIST DATABASE of handwritten digits

Fashion-MNIST

Iris Data Set

2.コンペデータ(Kaggle)

3.テーブルデータ

4.画像データ(物体認識)


5.画像データ(物体検出)

6.言語関係

6-1.JVS (Japanese versatile speech) corpus

7.マテリアルズインフォマティクス(MI)

7-1.Inorganic Crystal Structure Database (ICSD)

7-2.MatNavi

 NIMS 物質・材料データベース

7-3.Material Project

カリフォルニア大学を中心に整備を進めているデータベース

7-4.Aflow

 デューク大学を中心に整備を進めているデータベース

7-5.NOMAD Repository

NOMADが運用するデータベース

7-6.Polymer Genome

 ジョージア工科大学を中心に整備されている高分子材料用のデータベース

PubChem (nih.gov)

7-7.UCI machine learning repository

 カリフォルニア大学アーバイン校が管理&公開する機械学習データセットのリポジトリである。データセット提供サイトとして有名であり、学術系ということで信頼性も高い。

例:超伝導体材料のデータセット

7-8.Pubchem



履歴

2022年10月16日:初版発行(追って追加予定)


この記事が気に入ったらサポートをしてみませんか?