見出し画像

ひるタブ 22回目「連続と不連続」

グラフの作り方、一旦ここまでにして、Tableauのなかでとても重要な、連続と不連続について説明します。
本質的なところは難しいですが、日付での表現、金額の表現などの具体例を通じて体験してもらえればと思います。

■連続とは、不連続とは
不連続とは、離散値と言ったりすることも多くて、一つ一つの要素がバラバラで、集合の一つの要素みたいなものです。要素間には順番がある(つく、つける)場合もない場合もあります。その順番を用いて並べることもできます。

連続とは、区間(インターバル)でとらえ、その中の密度(測度でしたっけ)は小数だったり実数だったりしますが、その少し小さい大小もその区間に含まれるのも連続ならではです。
しかし、連続と言ってもデジタルデータなので、その一点はデジタル表現であり、整数の場合は1と2の間は隙間なく整数がならんでいるのだという概念的な整理になります。
Tableauにおいてなぜ大切なのかは、それが軸における表現に密接にかかわるからです。

次のようなのが一般的で、項目別の値で、項目ごとに連続的な値をとるグラフです。


X軸が不連続、Y軸が連続

次に、極端な例ですが整数における連続と不連続の例を出してみました。測度論的にはいい加減ですが、わかりやすさを優先してみました。


不連続と連続

整数で不連続というのは、1は点でしかなくて、その間はスカスカしてます。だからと言ってそこに少数や無理数があるわけではないのです。順序と大小関係はちゃんとあります。連続の場合は、隣はすぐの数なのです。不連続の場合、1と3だったとしたら、1の次は3という関係の順序と大小はあるのですが、2という存在があるかどうか関知しません。逆に連続の場合は、1,2,3という世界はあって、たまたま1,3というデータがここにあるということになります。とても理屈っぽい話になりますが、後の例で差がわかるといいですね。


少数で、連続と不連続

少数でも同じなのですが、図の順を逆にしたのは、連続の方がイメージしやすいかと、少数が稠密かどうかは無理数を意識するとスカスカですし、整数のように「次の数」を導出するのは、有効桁数等を置くといった整数と同じ仕掛けがいります。が、びっしり少数の空間はあるわけです。不連続だと、データの数だけ点があり、大小も順序もあるのですが、隙間については言及されません。

Tableauでの具体的な差の例
理屈っぽいことが続いたので、Tableauでの具体的な差の例を示します。
代表例は日付型です。時間軸と捉えると、時間は連続的な軸と捉えることができます。ほんの一瞬前とかです。


月ごとにちゃんと並んでるグラフ

他方、日付としてとらえると、普段2/28、2/29と一つ一つ離散的にとらえます。月別・州別のランキングは不連続だから、入れ替えてもグラフとして成立するわけです。

月がバラバラにならんでますが、各年の月の並びは同じであることに注目


折れ線で見ると月は年の中に繰り返しているのがよくわかります。

売上のような値は整数の連続、1の次は2で、利益率は小数の連続数です。売上のような値は合計値等集計にするためには連続である方が都合がいいことが多いのです。

ノーマル


日付を連続にする(年毎の繰り返しではなく)


売上を不連続にする(売上額ランキングになっている)

違いが伝わりましたでしょうか。売上を不連続にすると、売上の点の集合になるので、棒グラフや折れ線グラフだと値のあるところだけ詰まって表示されます。

表における不連続
表を作る時、最初にやったように、シェルフに入れるとグラフになるので、
ラベルにいれるか、複数の場合はメジャーバリューにいれて表示します。
但し、この場合はディメンションが先でバリューが後にくる並びしか表現できません。
ところが、不連続にすると、ディメンションに混ぜてシェルフで表示可能になります。

普通はこうやって、項目ー値の並びにする


不連続を活用することで、ディメンションの間にバリューを挟み込むことが可能になる。


不連続項目のソートは色々制約があるので思い通りにいかないが、うまく行くと大変効果的

予告:ディメンション・メジャーについて
連続/不連続とセットで語られるのが、ディメンション/メジャーです。この2つの組はまさに似て非なるもので、グラフにするときにはっきりと差になって現れます。ディメンションは、要素を並べただけの集合で、順序性も要素間の関係もありません。メジャーは合計や利益といった計算処理が可能なデータとその結果です。なら、ディメンションは非連続で、メジャーは連続かというと必ずしもそうでもありません。そのあたりも次回取り上げます。

この記事が気に入ったらサポートをしてみませんか?