データがなくても大丈夫!無料で使える学習用データを活用しよう~国外版~
こんにちは、皆さん!
前回、日本国内における誰でも無料で使えるデータセットをご紹介しました。
今回は、海外で提供されている無料のデータセットをご紹介します。
データ分析において国内外のデータを比較対象とする場面はよくあるので、ぜひご一読ください!
UCI Machine Learning Repository
最初に紹介するのは「UCI Machine Learning Repository」です。
カリフォルニア大学アーバイン校が提供する機械学習やデータマイニングに関するデータの配布サイトで、600個以上に渡る多様な分野のデータが揃っています。
サイト内では、分野ごとの検索はもちろん、データの種類(画像なのかなど)や特徴量の数などでもデータを選ぶことが可能です。
European Data Portal
続いて、EU(欧州連合)が提供する「European Data Portal」をご紹介します。
このポータルサイトでは、経済、環境、健康、交通といった幅広いテーマのデータセットが提供されています。
EUが提供するデータを使い、国際的な分析に挑戦することができます。
Data.gov
また、アメリカ合衆国政府が提供するサイト「Data.gov」も見逃せません。
Data.govでは、気候変動、エネルギー、教育など、政府機関や州、都市が保有する多岐に渡ったデータにアクセス可能で、社会的な問題に対する分析を行うのに有効です。
Kaggle
そしてデータサイエンスのコミュニティとして広く知られる「Kaggle」も忘れてはいけません。
Kaggleは、現在Google社が運営しているコンペティションサイトとして知られており、世界中から集められた様々なデータを提供しています。
提供されているデータを使い、データ分析のスキルを競い合うことができます。
データ分析の学習において幅広い視点を提供し、さらにスキルを磨く絶好の機会となります。
まとめ
今回ご紹介したサイトは全て原文が英語ですが、上手く翻訳サイトを使いながら英語の壁を乗り越えれば、日本のデータだけでは気づかなかった新しい事実や洞察に出会えるはずです。
ご紹介したサイトを使い、皆さんのスキルと視野を広げられるきっかけになれば幸いです。
【ワークスアイディのホームページはこちら】
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?