見出し画像

DataSaberで学んだこと【知識編】

はじめに

今回は、私のDataSaber最終試験が近づいてこともあり、学んだことを改めて文章として残すことで忘備録&復習をしてやろうと思います。
あくまで私のための忘備録として記載しているため、読みづらさ半端ないと思いますが、ご了承ください。
かかってこいやッ!!!!

連続・不連続

「連続」とは
0、1、2、3、というように、数字の順番が決まっているものを指します。
時間軸のように過去から未来へと連続して流れているものを指し、
日付などが当てはまります。
tableauでは緑色のピルで表現されます。

「不連続」とは
それぞれの値が独立しているものを指します
例えば、顧客名やオーダーIDには連続の値のように時間軸が存在しないことが分かると思います。
tableauでは青色のピルで表現されます。


それぞれの違いは代表的なものだと2点あると思います。
・「連続した値は並び替え可能、不連続の値は並び替え不可」

下記図は連続した値を使用したグラフです。
見てみると、並び替えをするアイコンがグレーアウトしていますね。

スクリーンショット 2021-11-13 12.44.40

一方で下記図は不連続の値を使用したグラフです。
見てみると、こちらは並び替えが出来そうですよね。

スクリーンショット 2021-11-13 12.48.07

不連続は「それぞれの値が独立している」ため、並び替えても問題ありませんが、連続は時間軸に沿って並び方が固定されているので変更できないというわけです。

・「色に追加すると色相・彩度で表示される」
下図は都道府県ごとに連続した値である売上をマッピングしたものです。
見てみると、各都道府県ごとに売上の大小に応じて彩度で表現されていることが分かります。

スクリーンショット 2021-11-13 22.56.08

一方で下記図は不連続の売上を使用したグラフです。
見てみると、こちらは各都道府県ごとに色相で色分けがされていますね。

スクリーンショット 2021-11-13 22.58.07

連続した値を使用すると、各数字の大小が判別できるので、彩度で表現することが出来ますが、不連続の値の場合だと、各数字が独立していて、大小が判別できないため、色相で表現されています。

データブレンドと結合の違い


tableauにはデータをくっつける際、主に2つの方法があります。
・結合
結合は、2つのデータソースに共通するカラムを結合キーにして、1つの表として結合します。
行単位でデータを照合し、集計などの計算する前に、1つのデータソースとして作成する形となります。


・データブレンド(ブレンディング)
データブレンドは、それぞれのデータソース毎に先に集計してから、2つのデータソースを混ぜます。
私のメンターさんは使わないほうが良いとおっしゃっていました。
その理由は各キーに対して複数の値が存在する場合、データブレンドではアスタリスクとして表示されてしまうからだと思います。


Preattentive Attributes

Preattentive Attributesは簡単に言うと、人がグラフを見た際、視覚情報の処理を無意識下で行われるグループのことです。
下記の種類にて分類されています。

スクリーンショット 2021-11-13 13.12.39

一般的に、
位置>色>サイズ>形状
の順で判別しやすいらしいです。
ですが、グラフの種類や項目の多さによって左右されると思うので、
作成する際は参考程度にしたほうがいいかなと思ってます。

Tableau Server/Onlineの機能

・データを自動的に更新する
・データの流出を防ぐ
・各コンテンツの利用状況、ユーザーの動向を把握する
・データの使用可能者・範囲・用途・権限を設定する
・Desktopで作成したVizの表示上の全ての機能をDesktopアプリケーションを持たないユーザーにも提供する
・ユーザー個別のフィルター条件を記憶してダッシュボードをカスタマイズする
・定期的にメールでデータビジュアライゼーションを自分あるいは関係者に送付する
・データが一定以上の値を示したときにお知らせを飛ばす
・データを見た人がコメントしたり所定の相手にメンションする
・Web上でVizを作成する
・Webパーツとして外部Webサービスに埋め込むことができる
・モバイル・タブレットなど多様なデバイスに対応する
・データの所在や情報を明らかにしてより活用を促す
・ログインした人に応じてそれぞれが見るべきVizを推奨する

Visual Analytics

画像7

Visual Analyticsは役割が重要です。
tableauでは役割ごとにライセンスが選択出来ます。
なぜかというと、レポートファクトリーと呼ばれる、

・分析結果を求めている「Task」を持っている人が自分でデータを探索することができず、他人に分析やレポーティングを依頼して作ってもらっている状態
・レポート作成依頼を受けるメンバーが過剰な依頼数に忙殺され、すぐに分析結果を依頼主に返すことができない状態
・依頼からレポート完成までに時間がかかり過ぎて、もはやレポートが完成する頃にはその分析結果が不要になっている状態

に陥ってしまうからです。

 Createrの役割
・データソースに接続し、自身や他のユーザーが利用できるものをデータから作成する
・組織で、レポートを作成し、メールや共有ドライブで配布する
・アドホック分析を行って、より深い質問の答えをデータから引き出す

Visual Analytics Cycleの役割は
・Task
・Get data
・Choose visual mapping
・View data
・Develop  insight
・Act(Share)
つまりは全部できる人です。
個人的にはCreaterは最もレポートファクトリーに陥りやすい役割だと思ってます。


Explorerの役割
・変化を実際に引き起こす人々を指します。
・ビジネスを前進させることを目指しており、データを詳しく調べて自身の質問の答えを見出す

Visual Analytics Cycleの役割は
・Task
・Choose visual mapping
・View data
・Develop  insight
・Act(Share)
つまりtask以外です。

Viewerの役割
・データを情報源にして、自分の意思決定の質を向上させる人々を指す。

Visual Analytics Cycleの役割は
・Task
・View data
・Develop  insight
・Act(Share)

実際にVizをみて行動する人ですね。
イメージとしてはレイヤーが上の方でしょうか。


次回

次回は私が知らなかった関数についてまとめていければと思います。



この記事が気に入ったらサポートをしてみませんか?