見出し画像

エンジニアが「データ視覚化のデザイン」を読んでみた

1,この記事は何

 この記事は,永田ゆかりさん(@DataVizLabsPath)の著書「データ視覚化のデザイン」(以下,本書)の一読者としての感想です.感想なのであまりアカデミックではなく,大分カジュアルです.
 「エンジニアが」と枕詞を付けたのは,筆者の人格を明らかにすることで,同業種の方にとってより印象深い投稿になれたらと思ったからです.更に言うと,私は社会人大学院性として生活しています.業務ではtabularなデータの収集・加工・分析・モデリング・運用を担当しています.可視化はBIチームに依頼しているため,普段はノータッチです.研究では信号処理の研究をしています.ビジュアルアナリティクスを体型的に学んだ経験は全くありません.

2,これは何の本

本書では、日本人女性唯一のTableau ZEN MASTERである筆者が長年にわたって培ってきたデータ視覚化のノウハウ、ベストプラクティス、アンチパターン等を整理分類してエッセンスを抽出し、具体的な事例をあげながら、できるかぎり丁寧に解説しました。また、セミナーなどの現場でよくされる質問に対する答えをまとめたものでもあるので、ある意味、"FAQ"でもあります。
引用:https://www.amazon.co.jp/dp/4815604053

 上記の通りです.紙面も(当然)カラーで紙質も良く視認性が高いです.

 この本は、どのようなビジネスであれ、データ視覚化(データビジュアライゼーション)をする機会がある全ての方に向けて書きました。いわゆる「ダッシュボード」と呼ばれるものを作っていらっしゃる方、また毎日の業務の中で「Excelで表からグラフにするのにどう言うグラフを使うのがベストなのか?」とお悩みの方に向けて買いた本です。
引用:データ視覚化のデザイン p3 はじめに

 対象読者として上記の通り設定されているようです.エンジニアは対象読者に含まれるかについてですが,エンジニアと一口に言っても様々な職種があると思われますが,ことデータを扱う仕事をメインに据えるエンジニアにとって,可視化は切り離せないスキルだと考えているため,私は含まれていると思っています(勝手に).

3,総評

 読んでためになる本でした.ビジュアルアナリティクスの領域を体型的に学んだことがない私にとっては,
・あらゆる概念を言語化・整理してくれたこと
作例が豊富なこと
正事例だけではなく負事例が多く掲載されていたこと
にこの本の魅力を感じました.以下それぞれのポイントについて書いていきます.

4,あらゆる概念を言語化・整理してくれた

 私もそれなりに社会人をやっているので,(主にプレゼンにおける)可視化のテクニック本はそこそこ読んできました.その本では外資系コンサルやプレゼンの強い人たちが懇意に説明してくれましたが,どれも目先の利益の最大化に向けたテクニックが多く,あまりロジカルではない(けど役には立つ)なぁという印象が強かったです.
 つまり,ライブラリは使えるけど理論は知らない,SVM使えるけどラグランジュの未定乗数法は知らない(そんなことあるか?),みたいな不安がありました.とりあえず色は3色までで表の枠線消せば良いんでしょ?みたいな.基礎がないと応用が効かないですよね.
 その点本書はまず言葉の定義から始め,色やゲシュタルトの法則など,感覚的に捉えていたことの言語化から初めてくれるので,導線として不安なく本を読み進めて行けたのでとても良かったです.
 またビジュアライズを語る上で避けては通れないユニバーサルデザインポリコレなどの倫理的な視座でも作例をあげていることが印象深かったです.

5,作例が豊富

 こういったビジュアライズ本では,作例の多さはとても大事だと思います.私個人的な意見かもしれないですが,直感的・視覚的な理解を主張する本なのに文字だけずらずらと並べられたり,2色刷りで色が良くわからなかったりすると,主張と内容が噛み合ってないとモヤモヤすることが多いです.なのでフルカラーで作例が多く,見ただけで分かり,かつ納得感が強い本書はとても良かったです.
 一番良いと思ったのは辞書的に使えるところだと思いました.第3章「目的に応じたチャートの選択」と言うところで,「このデータにはこの可視化」,と言う逆引き(?)のような使い方ができるので,まだまだ学習が浅く可視化の際に路頭に迷ったときは,本書を引いて見るのも良いと感じました.
 動線分析をやったことがあるのでサンキーダイアグラムとかは知っていましたが,ワッフルチャートとか正直知らなかったです…….
 知らなかったと言うか,知ってたけど改めて認識して,確かに場合によっては分かりやすいなぁと思いました.

6,正事例だけではなく負事例が多く掲載されていた

 私はあまり優れた脳を所持していないため,正事例だけ与えられても,次にきたサンプルが本当に正か負か識別することが極めて苦手です.

ダークにすればかっこいいと思ってる最悪な事例

 世の中には大変優れた可視化の事例が乗っていますが,それだけ見ても,新しいデータに対してどうすれば正解か,の判断が非常に難しいと感じます(それらは全て正事例,或いは正か負かの評価がされていない).
 ビジュアライズの本があるときに個人的に良書と思うポイントは,負事例が載っているかどうかを判断にすることが多いです.正事例と負事例をたくさん自分の脳に与えることによって識別境界を最適化していく方法が,自分にとってより良いアプローチをとることに繋がることと考えているからです.
 その点で本書には負事例がたくさん載っており,なぜダメなのか,ではどうすれば良いかの指南が豊富にあるのがとても良かったです.

7,最後に

 データの可視化の目的って,たくさんあると思います.データを扱うエンジニアにとっては,
1,rawデータを可視化してデータを良く眺めたい(自分で)
2,実験結果をチームリーダー(或いはラボのボス)に報告したい
3,研究結果をポスター発表したい
4,社内決済者に報告したい
5,データに詳しく無い顧客に説明したい
 などいろんなシチュエーションがあって,それぞれで可視化の仕方とか,粒度が変わってくるのは明らかで,かつ頭を悩ませるポイントだったりします.本書でも,

 どのようなダッシュボードを作るか?についてはオーディエンスと問いに応じて変わるもの
引用:データ視覚化のデザイン p172 オーディエンスを意識する

 と始まり,その思考のプロセスについて説かれています.

 すごくカジュアルにまとめてしまって大変恐れ多いですが,「データを前処理してplotlyでjupyter上に可視化してpdf出力とかパワポに貼り付けて顧客にポイ!」ではなく,その可視化のプロセスのところでちゃんと目的・オーディエンスを意識する必要性について多大な示唆,或いは適切な可視化(グラフ)への道筋を与えてくれる良書です.

 また,この本はビジュアルアナリティクスという深淵なる学問への導入書として最適なのではと思いました.例えばこの間弊社のチームで,「box plotの外れ値を表示する >1.5IQRの1.5ってどう言う根拠の数字なの?」と言う問いが上がったのですが,そう言う詳細な問いに対する答えは本書にはなく,また,tableauなどのBIツールの使い方も本書にはありません.本書から学べるのは考え方や視座であり,それを実現する技術は実務や参考書として挙げられていた本などを読み,身に付けていく必要があります.これは本書の立ち位置に対する私なりの所管であり,決して本書を貶めるためのものではありません.

以上です.



この記事が気に入ったらサポートをしてみませんか?