見出し画像

データ可視化ってどう勉強するかわからない話

「データ可視化を学んでみようかな」と思ったときに、みんな何で勉強してるんだろう。統計なら検定○級とか、予測モデリングならkaggleにチャレンジするとか、いろいろと目標やリソースがある。一方で、可視化は意外と初学者の足掛かりがないなと感じる。評価基準が曖昧だから目標立てにくいのかな。

Excel、Tableau、RやPythonなどいろいろなツールでなんとなーくグラフを作ったことはある。円グラフは比較しにくいとか3Dはよくないとか、それくらいは知っている。でもきちんと理論的に学んだことがなかった。


必要なスキルは何か

まずは関係するスキルを調べてみた。一般社団法人データサイエンティスト協会が公開しているスキルチェックリスト にて、可視化カテゴリのスキル項目はざっくり下記の通り。

 一般社団法人データサイエンティスト協会
データサイエンティスト スキルチェックリストver.5  より作成


ビジネス理解やエンジニアリング、結果の読み方など分析的視点も含む広い領域と関連することがわかる。どれも重要そうと思い、実務に当てはめてみると急にイメージしにくくなる。

「意味抽出」にある通り外れ値は見つけたいし、特異点や相違性も見つけたい。ただそのためのグラフは複雑で情報量が多いものになってしまいがち。でも「表現・実装技法」にある通り、適切な情報濃度判断は重要。だって一般的に「伝わる」グラフやダッシュボードはシンプルなものって聞いたことあるよ。見やすいグラフを作るためにデザイン勉強しようかな。でも加工もできないといけないし・・

必要なスキルから考えてしまい、一度このように混乱した。

そこで可視化の目的から考えてみると、スキルの具体的なイメージがしやすくなった。いくつかの書籍に書かれている通り可視化にも種類がある。「探索的可視化」「説明的可視化」と2種類(もしくはそれ以上)に分類されることが多い。

個人的な印象としては、説明的可視化はデータインク比のような情報濃度の判断やデザイン的視点、ダッシュボード設計など、わかりやすいビジュアライゼーションのスキルが重要になる。意思決定しやすく伝える必要があるため、分析の文脈ではなくビジネスの文脈への情報変換が重要そうに思う。

探索的可視化には、統計を活用した可視化やグラフの読み方など、よりデータを理解するためのスキルが重要になる。特徴を把握するため、グラフを適切に採用して適切に読み取る。グラフは複雑だったり細かい分類だったりもする。どちらかというと分析スキルの向上に付随するように感じる。

可視化を通じてビジネス領域の理解を深めたい、というのが目的のひとつなので、まずはビジネスに近い説明的可視化を学んでみたい。


ところで少し話は脱線するけど、スキルチェックリストは2023年10月30日に第5版が公開された。可視化のカテゴリに大きな変更点はなく、細かい文言修正がされている程度のよう。AI技術の活用などとは違い、必要なスキルにあまり議論の余地がないのだろうと感じる。

スキルチェックリスト新旧比較版:https://www.datascientist.or.jp/common/docs/skillcheck_ver5.00_cps.xlsx



勉強環境を考えてみる

何事も学ぶには守破離が大切。

  • 良いお手本をたくさん見る

  • 良いお手本を自分の手で再現してみる

  • お題を立てて実践を繰り返す

そのために真似できるお手本がたくさんある環境に身を置きたい。

特に「自分の手で再現してみる」ことが重要だが、可視化は利用ツールによって再現できたりできなかったり方法がわからなかったりする。でも目的はツールの勉強ではなく、良いビジュアライゼーションを学ぶこと。どのツールの環境に身を置くと、良い見本を再現しやすいかが大切になる。

いま説明的可視化を学ぶなら、という観点で Tableau に惹かれた。特に良いなと感じた点は下記の通り。お手本の数が多くて探しやすくて再現しやすい。

  1. 無料で利用できる( Tableau Public )

  2. Tableau Public にたくさんお手本が集まっていて探しやすい

  3. Makeover Monday や Workout Wednesday などのお手本も Tableau Publicに集約されていて探しやすい

  4. お手本の設定ファイルがそのままダウンロードできる

  5. 複数のライブラリやパッケージを行き来しなくてよい

癖のあるGUIの印象が強く苦手意識があったのだけど、触っているうちに少しずつ慣れてきた。処理も軽いので思考を止めずにビジュアライゼーションできるようになれるかもしれない。そうしたら探索的可視化も最初はTableauでやってみる日が来るかもしれないな。


余談

データ可視化を初めて学んでみようと思い、基礎的な書籍を読んだ程度の初学者のいま、感じることを残すべく書き留めた。まだ疑問も知りたいことも多くあるので少しずつ解消していこうと思う。

このスキルどうやって勉強するの?

探索のためのグラフの設計や読み方は、お手本になるリソースが少ないように思う。可視化というより分析に近いためか、特に適切な軸の選択方法や特異点や相違性の見つけ方が学びにくい。書籍や実践で学べるリソースを探していきたい。

その一つの方法となりそうなのが、データ可視化学入門(2023年12月発売予定)。可視化の設計や読み方が勉強できそうな目次が並ぶ。同シリーズのデータ解釈学入門も非常によかったのでこちらもとても楽しみですね。


伝わるビジュアライゼーションのつくりかた

伝えるためのビジュアライゼーションには、漠然とWebサイト制作のようなイメージを持っていた。デザイン、UX、UI設計や情報設計などの知識があればより良いものが作れそうだなと。良いダッシュボードのページを作るためにそれぞれ勉強するのもいいかもしれない。

そう考えながらデータビジュアライゼーションの書籍をいくつか読むと、編集的思考(Editorial Thinking)の考え方が非常に腑に落ちた。※「データビジュアライゼーション ―データ駆動型デザインガイド―」5章 編集的思考の確立

可視化作業を進めるうちに、見る側の視点が欠けてしまうことがよくある。情報を構造化したくなったり、無理に全体感を表現しようとしたりする。でも「編集」という言葉を心に留めると、相手の関心ごとに沿うという基本原則を思い出せると感じた。あまり触れてこなかったけど「編集工学」面白そうだな。


参考書籍


この記事が気に入ったらサポートをしてみませんか?