見出し画像

『データドリブンの極意』DAY1_HOMEWORK

①自分が分析しているデータの項目を4つのWに分けて整理する

分析データはNHK放送文化研究所の国民生活時間調査を利用する。
・データの種類 全員平均時間量/時刻別行為者率
・調査年 1995年/2000年/2005年/2010年/2015年/2020年

Who  世代(特に10代、20代)
What  テレビ時間(と、その減少因仮説としてのレジャー活動時間)
When  調査年、時間帯
Where  なし

②5W1Hと起承転結を組み合わせてデータストーリーテリングのデモンストレーションを作る

テレビ時間は何に置き換わったのか(Taableau Public)

起ーWhat

生活時間のうち、テレビ時間が年々減少している

承ーWho

10代から40代で減少幅が大きい

転ーWhere/What

10代、20代のレジャー活動時間が増加している

転ーWhere

10代、20代のレジャー活動は夜間のゴールデンタイムで増加している

ゴールデンタイムで10代、20代の若者がどんな「レジャー活動」をしているのか追加調査が必要

③だれかにデモンストレーションを聞いてもらいフィードバックをもらう(略)

振り返りー表現について

  • テレビ時間の推移・・・ラベルは不要かも。単位がわからないので。むしろヘッダーと軸を表示しておく方がよい?(ここは口頭で補足する前提で非表示にした) あと、傾向線も不要かも。

  • 世代別テレビ時間の推移・・・結構気に入ってるグラフ。ここは傾向線で傾きが緩くなってくる変化が捉えやすくなっていると思う。

  • 10代-20代の余暇時間・・・二重軸にして一方を形状にして◯を大きくした。これも結構気に入っているが、◯の大きさが何かのボリュームだと思われてしまう危険性はありそう。

  • 時間帯別レジャー活動者率・・・グラフタイトルが分かりにくい。「その時間帯にその行為(ここではレジャー活動)を行なっている人の割合」という意味。例えば午前2時とか3時とかでは睡眠の割合が90%を超える。また、年々夜間時間帯での割合が高くなっていることが直感的に理解できるかどうかやや不安。世代を縦に並べる(調査年が縦に揃う)ことで右に行くにしたがって色が濃くなる表現の方がわかりやすい? 縦長になることがネック。

  • 全体・・・傾向線を使いたかったので(特に世代別)、調査年5年ごとの不連続データが元だったが連続データに変換した。これによってテレビ時間の推移グラフは間が開きすぎているかも。余暇時間グラフの見え方はいい感じになってると思うが、ヘッダーで調査年以外が出ているので分かりにくくなっていないか気になるところ。

振り返りーTableauのテクニカルなこと

・時間がかかったこと
「行為者平均時間量」など時間形式のものが日付形式で読み込まれ、データソースの部分で文字列にデータ型変更ができなかった(内部ではできてたのかもしれないけどエラーメッセージが出て諦めた)

エラーメッセージ

ワークシートでディメンションの項目からデータ型を文字列に変更するとスムーズにできた。

・気づいたこと
web版Tableau Publicには「分割」「カスタム分割」のメニューがない?
※途中、アプリ版がうまく動かなくなったためweb版に作業移行しようとして気づいた

・参照した記事など(ありがとうございます)


この記事が気に入ったらサポートをしてみませんか?