見出し画像

【米大統領選挙データ 1】世論調査分析アプリでデータの中に潜り込む

いつものことながらStreamlitで分析アプリを作ってみました。今回は米大統領選挙の世論調査分析編です。まだ制作途中なのでこれからもっと色々な角度からの分析フィーチャーを付け加えていければと思っていますが、今のところの出来上がりはこんな感じです。

https://presidential-poll-2024.streamlit.app/

Note上で数回に分けて、大統領選を迎える11月まで分析状況をアプリで伝えてていければと思います。


データ元

まずはデータ元はFive Thirty Eightです。Five Thirty Eight(しばしば538と書かれる)は、世論調査の分析、政治、経済、スポーツブログに焦点を当てたウェブサイトです。統計学者のネイト・シルバーによって設立され、統計分析とデータ駆動のジャーナリズムを活用して、特に選挙やスポーツイベントに関する深いカバレージと予測を提供することで知られています。このサイトは、世論調査を集約し、自身で統計モデリングを行い、トレンドや確率についての洞察を提供します。
このFive Thirty EightのGenral Pollsというページから世論調査結果データをCSVファイルで取得し、データ分析アプリに使用しています。


分析アプリの紹介


トップページ

アプリは現時点では4つのページで構成されています:「一般世論調査」「調査会社」「スポンサー」「激戦州」です。

  • 一般世論調査」:すべての候補者に関する全体的な世論調査データを分析・可視化し、トレンドや平均値を表示します。

  • 調査会社」:異なる調査会社のパフォーマンスと信頼性を評価し、評価と過去の正確性を可視化します。

  • スポンサー」:世論調査をスポンサーする組織を調査し、その影響力と潜在的なバイアスを検証します。

  • 激戦州」:選挙結果に影響を与える主要な激戦州の世論調査データに焦点を当てます。

このNote記事では1ページ目である「一般世論調査」に焦点を当てながら、大統領候補における一般世論データの細かい動きなどを簡単に紹介していきたいと思います。

一般世論調査とは

大統領選挙に関する一般世論調査(General Polls)は、有権者の好みや意見を把握するために実施される調査です。これらの調査では通常、有権者がどの候補者を支持しているか、または投票する可能性が高いかを尋ね、選挙の全体的な傾向や結果の見通しについての洞察を提供します。選挙期間中の世論調査の結果は、時期によって変動し、現在の出来事、選挙運動の努力、候補者に対する世間の認識など、さまざまな要因の影響を受けます。

支持率の時系列プロット

まず最初のページのトップには、現在の候補者に対する日次支持率の時系列プロットを表示し各候補者の支持率が時間とともにどのように変化するかを示しています。

各データポイントは、特定の日に調査回答者がその候補者を支持する割合を表しています。これらのトレンドを分析することで、出来事、選挙運動の戦略、およびその他の要因が世論にどのように影響するかを観察できます。このプロットは、選挙期間中の候補者の人気と勢いを理解するのに役立ちます。

このプロットのタイムラインは今年の初めから始まっており、最近のトレンドを見たいユーザーにとってはあまり役に立たないかもしれません。そこで、次のプロットは直近30日間のデータを表示しています。

ちなみに青色の線がハリス副大統領、赤がトランプ元大統領、紫色がバイデン大統領です。バイデン大統領が選挙戦離脱の発表をした後から紫のデータポイントが消えているのが分かるかと思います。ハリス氏とトランプ氏の支持率は上がり下がりがあり、接戦していることも分かります。「第3の候補」とも呼ばれれ、ケネディ元大統領の甥にあたるロバート・ケネディ・ジュニア氏(黄色)の支持率はおおよそ8%付近で上下しています。

候補者による支持率のボックスプロット

そして次のタブをクリックするとボックスプロットが見えます。これは直近30日間における現在の候補者による支持率のボックスプロットです。各候補者の支持率の分布を視覚的に要約しています。ボックスプロットは、データの中央値、四分位数、および潜在的な外れ値を示し、最近の期間における支持率の中心傾向と変動性を理解するのに役立ちます。このプロットは、異なる候補者の支持率を比較し、重要な変化やパターンを特定するのに有用です。

ボックスプロットからわかることは、トランプ氏が支持率でハリス氏を上回っていますが、それと同時にアウトライアーと呼ばれる潜在的な外れ値も数多く存在することも考察に入れておかなければなりません。ハリス氏にはまだアウトライアーがあまり存在しないものの、彼女の場合は選挙戦に参入してからまだ日が浅く、他の候補者よりもはるかにデータが少ない事も考慮しなければなりません。

次回のNote記事では。。。

ポールスターとスポンサーについて分析していきます。ポールスターとは世論調査を実施する個人または組織のことで、スポンサーは、調査に資金を提供し、依頼する組織や個人です。ポールスターとスポンサーの関係は、世論調査を実施する上で非常な重要な役割を担っています。

例えば以下のBloombergの記事、この場合はBloombergがスポンサーメディアでMorning Consultという大規模な調査会社がポールスターの役割を担って、そしてこの記事がボールスターが行った世論調査のデータを基にしてこの記事が書かれています。

詳しくは次回のNote記事でデータを参照しながら解説していきます。

いずれにせよ、今年のアメリカ大統領選挙は、さまざまな角度から見ても前例のない事態となっており、これまでにない領域に達したと言っても過言ではありません。だからこそ、データを多角的に分析することで、新たな視点や洞察が得られるかもしれません。


🖊️何か気づいたことやご意見などがあればコメント欄からお願いします。チャンネルフォローもよろしくお願いします。

🚀 疑問に思った事はデータ化して自分なりの答えを探していこうと思います。そしてその答えがどこかにいる誰かの為になる事を願っています。

この記事が気に入ったらサポートをしてみませんか?