見出し画像

Googleデータアナリティックス - 7週目:定性データと定量データ・測定指標

Googleデータアナリティックスという、データ分析を仕事にしたい人向けの講座を受講してます。全6か月分、計30週分のコースで優秀なデータアナリストになろうという内容です。

今回は定性データと定量データ・測定指標を使ったデータ分析と可視化情報の共有の仕方について学習しました。

データと意思決定


データは様々な事実の集まりである。データ分析は、データを意思決定に役立てることができる。データを意思決定に役立てる手法は、
データ主導(Driven)の意思決定データ発想(Inspired)の意思決定の2種類がある。

データ発想の意思決定 - 異なるデータから共通点を発見する。
Googleでは人工知能を使ってデータセンター内の温度を計測・分析することで、サーバーの冷却効率を40%以上高めた。データ主導の意思決定との具体的な違いについては後ほど解説がある。

関連した意思決定に役立つデータは何か

・起床時間
 睡眠時間と起床時間
・外食する、またはしない
 外食した日付・時間帯・出費
・お金の使い道
 生活必需品・自己啓発に役立つか・役立たないか
・ラジオで何を視聴するか
 ラジオの視聴時間・番組内容
・電話をかける相手
 電話を掛ける意図・時間帯・相手のプロファイル

定性データと定量データ

・定量データ
数値的な事実を具体的・客観的に測定する
チャート・グラフなどに視覚化できる

・定性データ
数値化できない性質や特徴を主観的に表現する
定性データが観測された数を度数・割合等にすることで視覚化できる

データ分析においては、定量データに対応する定性データを回帰的に分類して「何故この値になったのか」という答えを出すことが多い。定性データは理由やより詳細な説明を含み、定量データをよりよく理解するのに役立つ。
定量データでは「何を」定性データでは「なぜ」を知ることができる。

データを情報化するためのストーリー

・レポート(Report)
データの集合体をステークホルダーを共有するための資料
長所:一時的なデータを共有するのに適している、デザイン資料にするのが簡単、クリーンな分類済みのデータを参照できる
短所:メンテナンスが必要、視覚化に適していない、リアルタイムなデータでない

・ダッシュボード(DashBoards)
リアルタイムで観測されるデータを監視
長所:長期間にわたって動的なデータを参照できるレポートを作成する時間を短縮できる、視覚化に適している
短所:システム・データベースの設計に時間・費用・労力が必要、仕様頻度が低いとレポートよりも非効率

・ピボットテーブル(Pivot Table)
データの集計に用いるツール。データの要約・並べ替え・再整理ができる。

ビジネスで活用するダッシュボードの種類には、以下の3例がある。

戦略型:最高レベルの測定指標で、長期的な目標や戦略に焦点を当てたもの
運用型:短期的なパフォーマンスの追跡と、中間目標の設定
分析型:データセットとその中で使用される数式により構成される

各ダッシュボードの共通点と相違点

・似ている点
データを定量データの可視化・定性データの度数化などを駆使して視覚化している。測定目標と実際のデータを比較できるようにし、ギャップ分析を行えるようにしている

・異なる点
目的ごとに異なる測定指標を視覚化している。収益、コール解決率、総資産利益率や自己資本比率など

企業がダッシュボードで使用する可能性のあるデータソースの例

コンサルタント
収益(実収益+目標収益、達成率)、顧客数(新規顧客数+目標顧客数、達成率)とその前年度比

コールセンター
コール解決率と未解決率、解決率・未解決率の時系列データ

財務
総資産利益率、自己資本比率の時系列データ、バランスシートの時系列データ

データと測定指標

・測定指標(Metric)
定量化できるデータの一種。
販売数×販売金額から収益を求める事は、データを測定指標に変える例である。

ROI(Return on Investment、投資収益率)は、純利益 / 投資コスト という計算式で表される。これは測定指標から新たな測定指標を求める例である。

測定指標を使って企業が設定する目標を評価することを、測定目標という。

数学的思考とデータ

スモールデータ
・定量か・定性かが明確
・短期間に収集されたデータ
・数日単位の意思決定に役立つ

ビッグデータ
・データの特定性が低い
・大規模な疑問・課題の検討に有効
・企業単位の大きな意思決定に役立つ

数学的思考をビッグデータを分析する際に役立てるには、主要な変数・関数を抜き出しそれらの相互関係が意思決定に役立つパターンとなるようにする。その為には、タスクに適したツールを選択する。
大規模なデータを処理するには、多くの場合SQLが用いられる。

この記事が気に入ったらサポートをしてみませんか?