ビジュアルアナリティクスサイクルの実践
はじめに
DATA Saber認定プログラムのコミュニティ活動において、Tableauに関するブログ執筆を実施する。その第1弾として今回は、自身の知識の習得を目的に公開データを元にしたビジュアルアナリティクスを実践した。
なお、DATA Saberに興味を持たれた場合、公式サイトを参照すること。
ビジュアルアナリティクスとは
ビジュアルアナリティクスは以下のプロセスからなる。
Task(問いを持つ)
Get data(データを取得する)
Choose visual mapping(ビジュアルマッピングを選択する)
View data(データを表示する)
Develop insight(示唆を獲得する)
Act(アクションを起こす)
各プロセスを実施する中で初めて分かることも多々あるため、本プロセスはTaskを起点にスタートしながらも、相互に行き来することが重要である。
しかし、その行き来の中でつい本来のTaskを忘れ、データ分析すること自体が目的となるケースがデータ分析プロジェクトには多い。
そこで、相互のプロセスを瞬時に行き来することを可能にし、本来のTaskを常に見失わせないことをサポートするのがTableauをはじめとしたBIツールである。
ビジュアルアナリティクスの実践
以下の仮想ケースにて、Tableauを用いてビジュアルアナリティクスを実践する。
1.Task
とあるエンタメ企業がオフラインイベントの開催を検討している。ライブやその他オフラインイベントの開催地選定をデータを元に上司に説明したい。そこで、地域により余暇時間に差があるという仮説のもと、より余暇時間の多い都道府県にてイベントを開催したい。
2.Get data
総務省統計局の令和3年社会生活基本調査のおける、日本人の10歳以上の活動カテゴリ別の平均活動時間を取得した。
なお、活動カテゴリの定義は以下のとおりである。
3.Choose visual mapping
都道府県別の余暇時間が見たいため、地図を選択する。
活動カテゴリごとの時間を見たいため、積み上げ棒グラフを選択する。
4.View data
都道府県別で活動カテゴリ別の平均時間を可視化した。
5.Develop insight
積み上げ棒グラフで地域別で見ると大きな差は見られない。
MaxとMinでどれくらい違いがあるかを地図で表示したところ、最大40分程の差が見られる。しかし、この可視化結果ではまだオフラインのイベント開催地を決定できない。
4.View data(再)
都道府県別ではなく、5大都市か否かで活動カテゴリ別の平均時間を可視化した。
5.Develop insight(再)
5大都市か否かでも大きな差は見られない。
※なお実際のデータは都市ではなく都道府県別データのため、5大都市というのは厳密には誤りである。時系列で見ると変化が見られる。
1次活動は増加傾向にある。
高齢化だから?
2次活動は減少傾向にある。
学生が勉強しなくなった?
家事の負担が減っている?
3次活動も減少傾向にある。
オフラインイベントを開催するよりも、1次活動(食事や睡眠)の合間に「ながら」で楽しめるエンタメ(音声コンテンツなど)がヒットするのではないか?という示唆が得られる。
6.Act
性別・年代別・職業別の活動データがないため、オフラインイベントの開催地を決定するアクションに至らない。
そのため、これらのデータを取得して分析を深めるのがネクストアクションである。
また、このビジュアルアナリティクスの過程で得られた示唆を元に「ながら」で楽しめるエンタメの企画を行うのも一案である。
参考
この記事が気に入ったらサポートをしてみませんか?