見出し画像

データ分析:なぜデータの視覚化?

データ分析の工程の中に、データの視覚化というものがあります。

視覚化には、棒グラフや円グラフを使ってみたり、論文で出てくるような分布図を使ってみたりと、表現方法もたくさんあります。

なんとなく、データの視覚化が大切なことはわかります。

しかしなぜ、データの視覚化が必要なのか?どうやって使う図表を選べば良いの?という点については気になっている方も多いのではないでしょうか。

この記事では、データ分析について、履修中のGoogleの資格コースの内容を基にまとめました。

まとめ

  • データの視覚化とは、データ分析の結果を図形として表現すること

  • その目的は、関係者にわかりやすくデータ分析結果を伝えるため

  • 望ましい視覚化には、4つの要素を満たすことを勧める枠組みがある

  • 視覚化に使う図表には、棒グラフや分布図など、6つ以上の表現の種類がある

  • 図表を選ぶのに、Googleは、判断手順をまとめたフローチャートを利用することを勧めている。


視覚化の目的

視覚化の目的は、データ分析の担当者が、データ分析結果を関係者に、わかりやすく、正確に伝えるためです(Ohio University, etc)。

そのために、データの分析結果を、図形などの写実的な表現に落とし込む作業を、データ視覚化と読んでいます。

視覚化を考えるときの枠組み

視覚化をする際に、何から手を付けて良いのか迷いませんか?

Googleのコースでは、デイビッド・マッキャンドレス氏が考案した、以下の図を参考にして、必要な要素を満たしていることを確認することを勧めています。

良い視覚化の何でできている?(引用元:What makes good visualization?, online)

このモデルでは、以下の4つの要素を満たすと、視覚化に成功したことになるとしています。

  1. 情報    :扱っているデータ

  2. 物語    :明朗で説得力のある説明書き(または概念)

  3. 目標    :視覚化のための特定の目的(または機能)

  4. 視覚の形態 :効果的な比喩や視覚表現の使用

視覚化の方法・種類

それでは、視覚化の表現として、どのような種類のものがあるのでしょうか?

このコースでは、以下の図表が紹介されています。

  • 棒グラフ

  • 線グラフ

  • 円グラフ

  • 地図

  • 度数分布図(a.k.a. ヒストグラム)

  • 相関チャート

各図表で、視覚化に利用する際の目的が異なります。

判断に使うフローチャート(判断ツリー)

多様な視覚化の表現方法があることがわかりました。

ただ、実際に選ぶ際、迷うと思いませんか?

そこで、Googleは、「判断ツリー(英語: Decision Tree)」を使うことを勧めています。

判断ツリー(引用元:Google社)

以下が例です。

  • 一つ以上の数値を使う場合 → ヒストグラム、密度プロット を選ぶ

  • データ間の関係性を見せたい場合 → 散布図、ヒートマップ を選ぶ

    実際は、より複雑なパターがあると思いますので、上記判断ツリーは参考例としてください。
    ポイントは、判断ツリーのような基準を設けておくと、視覚化の判断が早く正確になるということでです。

以上、データの視覚化についてまとめました。

このような記事が参考になるようでしたら、ライクボタンを押していただけると参考になります。

それでは、皆さん本日も良い一日をお過ごしください!

この記事が参加している募集

やってみた

この記事が気に入ったらサポートをしてみませんか?