見出し画像

【DATASaber】ツリーマップってどう使うの?

こんにちわ。atsushiです。
DATASaber認定制度への参加によりデータ分析に足を踏み入れて、初めましてのグラフがいくつかありました。

その中でも、これってどんな時に使えるの?って思ったグラフの一つがツリーマップです。

今回は、ツリーマップが使える場面、注意が必要な場面について考えたことを書いていきたいと思います。

ツリーマップってこうゆうやつ

ツリーマップとは

ツリーマップとは、

データの階層構造とそれぞれの要素の大きさを、視覚的に分かりやすく表現するグラフです

だそうです。

初めて見たとき、
「それぞれの要素の大きさ(比率?)を示すのはわかるんだけど、どこが階層構造なの?」
と思ったんですが、↓こうゆうことでした。

階層構造ってこうゆうこと!

全体を大きな四角(上位階層)として、ネストされた要素を四角く区切っていくことで上位階層の中での大きさ(割合)を示していくということですね。

もちろん2つの階層だけでなく3階層や4階層でも表現することはできます。

↑の画像は、2階層で表現したもの(① 全製品 > ② サブカテゴリー)ですが、3階層(① 全製品 > ② 出荷モード > ③ サブカテゴリー)にして表現するとこんな感じになります。

① 全製品 > ② 出荷モード > ③ サブカテゴリー

こう見ると、階層化で表現されていることがよくわかります。

各階層ごとに左上から右下にかけて小さい割合のものが並ぶようになっていますが、「ツリーマップ 画像」でググるといろんなツリーマップが出てきて順番に並んでないのもあったので、ツリーマップだからこうしなきゃいけない。というわけではなさそうでした。

でも、せっかく表現するのであれば、並び順も意味あるものにした方が優しいですよね。逆に並ばせない理由があんまり思いつかない、、、。
(Tableauでは、必ず割合が大きい順に並んでます。これ並び替え変える方法あるのかな?誰か知ってたら教えてほしい。多分ほとんど使うことないだろうけど。)

ツリーマップはこうゆうときに使え!

そんなツリーマップ君ですが、こうゆうときに使うべきだろう。というのをDATASaberの課題の復習も兼ねて、考察してみました。

全体の中での割合を示したいとき

単純に量の大きさを知りたいのであれば、preattentive attributesの強さから考えて、棒グラフを並べて見てしまうのがわかりやすいんだと思います。

ただ、全体(上位階層)の中での割合を知りたいのだとすれば、ツリーマップがぱっと見わかるという点で優位に立つ気がします。

↓は、サブカテゴリ毎の売上の比較をしたものです。

大きさはわかるけどそれぞれの割合はわかりにくい
こうゆう表現もあるかもだけど、、、
この方がぱっと見わかりやすい!

分類の多いデータを扱うとき

割合を示すという点では円グラフもありますが、円グラフは分類が増えるとどんどん見づらくなっていってしまうので、そうゆうときはツリーマップが見やすくなる気がします!

あとは、分類で比較したいときに棒グラフだと、どうしてもスクロールバーつけないとグラフが小さくなりすぎちゃうってときも、意外とツリーマップにしたら上手くいくこともあるかもしれないな~とかも思いました。

スクロールバー絶対つけたくない!って人には一つの手として持って置いて損ではないかもしれないですね。

どうしてもスクロールバーついちゃう
ツリーマップなら一応おさまる!

階層化構造を持つデータを比較したいとき

ここがツリーマップの醍醐味だったりもするのかなとも思ったりするのですが、やはり階層構造が表現できる点は見逃せないです。
この階層のうちのこれぐらい」ってのと「全体のうちのこれぐらい」が同時に見たいときはツリーマップ、結構役目果たしてくれる気がします。

階層別で大体の割合がわかる

こんな使い方も、、、。

設問の解説で出てきた例です。
行や列で四角自体を区切ってあげるとこんな見方もできます。

オーダー年でツリーマップを分けた

オーダー年毎に区切った上で、サブカテゴリに色を付けてあげることで、パッと見で年毎にどう推移したのかを把握することができます。

ただし、列や行で四角を分ける場合は、分ける数がそこまで多くないことが前提かなと思いました。
あんまり多いと、分けたときに元の四角自体が小さくなってしまい、ツリーマップの魅力が半減していってしまいそう。

こうゆうときは注意が必要

ここからは使うにあたって注意すべき点について書いていきます。

並び順が重要な指標となる場合

先日、同期でordeal6の勉強会を行ったのですが、その時の師匠の教えです。
「1番目に大きいのはわかるけど、2番目は右のやつか下のやつかパッとはわからない。正確に順番を把握したいときは向いていない。」

確かになぁーですね。
割合の順序という意味では傾向を把握するレベルにとどまるのだなと。
もちろん割合のラベルをつけてあげれば、補助的にわかるはわかるんですが、パッと見た時にわかるかといったらわからないので微妙な感じ。

売上のランキングを知りたいときには棒グラフの方が圧倒的に見やすい

分類が少ないものを比較したい場合

上記で書いた使うべき時の裏返しになるのですが、分類が2つや3つなど少ない場合はあまり効果を発揮しないかもしれないです。
比較する分類に差があまりなかったら、ただ四角が並んでるだけのよくわからないチャートになっちゃいそうです。
色で別の指標を表現するのであれば、意味を成してくるかもしれないですがそれだったら違うグラフを使うのがよさそう。

なんともいえないシュールな感じ
こっちの方がわかりやすい

分類の数が多すぎるのも、、、?

分類の多いデータを扱うときに使えるかも!ってさっき伝えたところではあるのですが、多すぎるのも場合によっては効果を発揮できないかもしれないです。
↓が売上データを市区町村で分類したものになります。

なんというか右下の方が、ただのタイルみたいになっちゃってて何かインサイトを得られる気がしない。
もちろん何を見たいかの目的にもよるとは思うんですが、もっとよい表現方法があるきがします。

最後に

ツリーマップについて、復習を兼ねて考察してみました。
書きながら色々とツリーマップについて考えをめぐらしたんですけど、正直使いどころ結構限られてくるのかな?って思ってしまっています。

「きっとそうじゃなくて、自分の分析脳で考えられるバリエーションが少ないだけ」と思う自分がいるので、
ツリーマップでの表現の幅を広げられるようにもっと学習に励みます!

以上でした!

余談

ツリーマップ見てると「黄金長方形」に見えてきて、若かりし思い出を想起されるんですよね。

過去に通信制の芸術大学に一瞬だけ通ってたことがあって、その時に出された "黄金螺旋を書け" という課題がなかなかうまくできなくて、、、。
それまで自分は手先器用な方だと思ってたけど、不器用なんだなーと打ちのめされた出来事でした。

というわけで、親しみ持てるので、ツリーマップ君、私は結構好きです。

いいなと思ったら応援しよう!