見出し画像

【DATASaber】自作Viz②

-Agenda-
1. 投稿目的
2. 自作Vizのタイトル
3. 作成したViz(URL)
4. 分析背景
5. データの出典元
6. Vizの作成
7. レビュー
8. Vizの修正
9. 所感

1. 投稿目的

  内容は「【DATASaber】自作Viz①」で説明した通りなので割愛。

2. 自作Vizのタイトル

20代30代人口と平均初婚年齢の相関分析

3. 作成したViz(URL)

[レビュー前]

[レビュー後]

4. 分析背景

 そろそろ結婚を考える年齢に近づきつつあり、今の世の中は何歳ぐらいで結婚を決める傾向にあるのかが単純に気になったため、今回は「初婚年齢」を題材とした。近年「晩婚化」や「高齢出産」などのキーワードをよく耳にするように、結婚に対する考え方も変化しつつある。だが、国内でも場所によっては一概に言えないのではないかとも思われたため、そんな仮説を検証すべく今回のViz作成に至った。

5. データの出典元

・都道府県,年齢(5歳階級),男女別人口-総人口,日本人人口(2016~2019年10月1日現在) - e-Stat 政府統計の総合窓口


・都道府県別にみた年次別夫妻の平均初婚年齢(各届出年に結婚生活に入り届け出たもの,2016~2019年) - e-Stat 政府統計の総合窓口


6. Vizの作成

 Vizは下の画像のように作成した。

画像1
クラスター分析散布図
画像2
クラスター分析散布図(除外後)
画像3
クラスター分析マップ

 本Vizは右上のフィルターのボタンを選択することで3つのワークシートが切り替えて表示される仕様となっている。

 1枚目は、国内の20,30代の人口平均初婚年齢との相関をはかるため散布図を作成し、その散布図をクラスター分析した結果を示したものとなっている。ご覧の通り、20,30代の人口が多く、平均初婚年齢も高めの橙色のクラスターは値が分散していたため、もう一方のグレーのクラスターに焦点を当てて再度クラスター分析をかけることにした。

 2枚目は、1枚目の橙色のクラスターを除外した上で、改めてクラスター分析を行った結果を示したものとなっている。さらにプロット点の傾向やクラスターを可視化させるために、今回は傾向線注釈を用いて明記した。

 3枚目は、2枚目のクラスターをマップ形式で示したものとなっている。2次元のグラフに加えて地図上でも調べることで、位置関係の傾向等もつかめることを期待して配置させた。

 最後に、今回のVizは「【DATASaber】自作Viz①」と同時並行で作成した関係で、自作Viz①と同様に分析対象と分析を行った上での自身の考察点を余白にダッシュボードのテキストを用いて書き込んでいる。

 以上を踏まえて、本Vizのレビューを師匠に依頼した。

7. レビュー

 師匠にレビューを頂き、指摘された点は次の通りだった。

①西と東で見るなら、グループで西と東をつくるのもあり。
②ワークシート選択で、3枚目を意図的に出しているのであればそれでよいが、1つ目でパブリッシュした方がよいかも。

 ①は、東西で比較して考察をまとめていた点からの指摘だと思われた。今回2段階でクラスター分析を行ったわけだが、特に1枚目の分布図から得られるインサイトがスペースのわりに少なかったと思われた。同じスペースでもより多くのインサイトが得られるようなVizを作成する観点でいけば、東西で区切ったほうが良いと判断した。
 ②は、地図の必要性について問われた内容だった。既述の通り、個人的には位置的な傾向(例:海沿いの都道府県に多く見られるなど)もつかめることを期待してマップのワークシートを作成したわけだが、その意図が第三者には伝わらなかったと言える。反省点としては2枚目の散布図と3枚目のマップをフィルター選択して別々に表示させていたことだと考える。散布図のクラスターに対応した都道府県の位置を表示させたかったので、少なくとも散布図とマップは同時に見せる必要があったと思われた。このことから、マップのワークシートは残しつつも、フィルターによるワークシート選択の機能は不要だと判断した。

8. Vizの修正

 上記のレビューを受けて、Vizを下の画像のように修正した。

画像4
修正後のViz

 主な修正点としては次の通りである。
東日本西日本でグループを作成
ワークシート選択を消去
ワークシート間の関係性を明確にする説明文の追加

 ①は、「グループ化」の機能を用いて東西に都道府県を区切った。そして東西別に散布図を作成した上でクラスター分析を行った。結果論かもしれないが、東西で散布図の傾向に違いが見られたので、レビュー前よりも散布図から得られるインサイトも増えたと考察できる。

 ②は、ワークシート選択のフィルターを無くして、3枚のワークシートを同時に表示させる仕様に変更した。これにより、散布図とマップの関連性を明示することができたと思われる。ただ、この3枚のワークシートの配置にとても悩まされた。例えば下のようなレイアウトも考えらえる。

画像5
散布図を上下比較する場合

 これでも一応こちらが意図しているような使い方はできると思われる。いわば、散布図を上下に並べるか左右に並べるかの2択である。個人的には2者を比較する場合、つまり今回だと東日本と西日本の両者を比較する場合は、上下よりも左右に並べたのほうが見やすいのではと思われた。ただこれといった根拠もないので、今後検討を重ねる必要があるだろう。

 ③は、あくまで補足的な要素だが、散布図とマップの関連性を強調するために「注釈」を用いて、散布図のプロット点やクラスターを選択すると、それに対応した都道府県が表示されることを明記した。これにより、レビュー前と比べるとマップの必要性を主張することができたのではと思われる。

9. 所感

 今回のViz作成を通して、データのフィルターの仕方によってVizの中身も大きく変わることが実感できた。今回は「2段階のクラスター分析」から「都道府県を東西でグループ化」に変更したことで同じスペースにおけるVizでも得られるインサイトが増えたことが分かった。同じデータでも活かすかダメにするかはデータの切り口次第だと言えるのかもしれない。今回はたまたま東西にグループ化したことで考察できる点も増えたので良かったが、区切り方を変えても大して変化しないケースも考えらえる。そうなるとフィルターのレパートリーもたくさん持っておいた方が良いと思われた。今後Vizの作成を通して、「○○で分けてみたら△△みたいなものが得られるんじゃないか」のようなトライ&エラーを重ねて、視野を広げられるようにしていきたい。

以上

この記事が気に入ったらサポートをしてみませんか?