見出し画像

EDA Salon 第11回 - アメリカの大統領選の世論調査データ

こんにちは、Exploratoryの白戸です。

Exploratoryでは、データサイエンスをみんなで学べる場として、「EDASalon」を実施しています。

EDAとは、Exploratory Data Analysis(探索的データ分析)のことで、データラングリング(データの加工)したり、データを可視化したり、アナリティクス(統計、機械学習)を使ってデータを分析することで、データの中にあるパターンやトレンドを見つけ、役に立つ情報を得ていく手法をまとめたものです。

EDASalonの詳細はこちらをご覧ください。

そして、今回のEDASalonのお題は、『アメリカの大統領選の世論調査データ』です。

アメリカでは2020年11月3日に大統領選挙が行われます。 共和党から現大統領のドナルド・トランプ氏、民主党からジョー・バイデン氏が選出されています。

この世論調査のデータを使って、大統領に就任するのはトランプ氏か、それともバイデン氏か予想してみてください!!

2016年のアメリカの大統領選は世論調査の結果ヒラリー・クリントン氏が優勢だと言われていましたが、勝利を収めたのはトランプ氏でした。アメリカの大統領選は、全国からの投票数が多い人が勝つというわけではなく、州ごとに人口をもとに決められた選挙人がおり、その選挙人の投票数によって勝敗が決まります。

アメリカの大統領選の仕組みについては、BBCのこちらの記事が参考になると思います。

データ

データはネイト・シルバー氏が率いるFiveThirtyEightがgithubで公開しているPresidential General Election Pollsのデータを分析に使いやすいように加工したデータです。

データは日本時間の午前12時(深夜0時)に毎日自動更新されます。

データをダウンロードする

Exploratoryをお使いの方は、データカタログを使って簡単にインポートすることができます。

画像1


それぞれの列の説明はMetadataにある、「Data Dictionary」から見ることができます!

画像2

EDA Salonへの参加方法

Exploratoryでデータを可視化したり、分析したら、それをノートに簡単にまとめて、「EDASalon」というタグ付きでパブリッシュしてみて下さい!

EDA Salonへの参加方法の詳細は下記をご覧ください。

 - EDA Salon: 探索的データ分析をみんなで学ぶ場
 - EDA Salonへの参加方法

Exploratoryをまだ持っていない方

Exploratoryをまだお持ちでない方は、フルバージョンを30日間の無料トライアルで試すか、パブリックバージョン(Exploratory Public)を無料で使うことができるのでぜひサインアップしてみてください。

 - Exploratoryフルバージョンの無料トライアルを始める方法
 - Exploratory Public(パブリック版)のページ

この記事が気に入ったらサポートをしてみませんか?