OpenSource/データベース:Dataset・学習済みモデル(重み)
機械学習で使用できるデータセット・学習済みモデルを紹介します。なおオープンソースにはライセンスがありますがMITライセンスであればほぼ自由に使用が可能です。
1.有名・一般的データ
THE MNIST DATABASE of handwritten digits
Fashion-MNIST
Iris Data Set
2.コンペデータ(Kaggle)
3.テーブルデータ
4.画像データ(物体認識)
5.画像データ(物体検出)
6.言語関係
6-1.JVS (Japanese versatile speech) corpus
7.マテリアルズインフォマティクス(MI)
7-1.Inorganic Crystal Structure Database (ICSD)
7-2.MatNavi
NIMS 物質・材料データベース
7-3.Material Project
カリフォルニア大学を中心に整備を進めているデータベース
7-4.Aflow
デューク大学を中心に整備を進めているデータベース
7-5.NOMAD Repository
NOMADが運用するデータベース
7-6.Polymer Genome
ジョージア工科大学を中心に整備されている高分子材料用のデータベース
7-7.UCI machine learning repository
カリフォルニア大学アーバイン校が管理&公開する機械学習データセットのリポジトリである。データセット提供サイトとして有名であり、学術系ということで信頼性も高い。
7-8.Pubchem
履歴
2022年10月16日:初版発行(追って追加予定)
この記事が気に入ったらサポートをしてみませんか?