szkok

Tableauのうやむやに向き合う

szkok

Tableauのうやむやに向き合う

最近の記事

14.計算順序がある?:クエリパイプライン

クエリパイプライン=Tableauの操作の順序 Tableauがアクションを実行する順番。 Tableau の操作順序は、上から下に次のようになっているそうで。。。 日本語版 ちょっとイマイチよくわからないので、少し深堀します ①抽出フィルター・Tableauに取り込んだ後に処理を行うフィルタ ・グラフ作成時のフィールド全体に影響 ・シートにデータを読み込む前にフィルタ  ⇒パフォーマンス向上 ・ここで前処理したデータは、抽出データ(.hyper形式)として保存 ②デ

    • メモ:複数のデータソースを利用する

      データソースの見え方が何か違うと思ったら、 どうやら3種類あるらしい データブレンド データ結合 リレーションシップ データを関連付けるときに ・キーとなる関連フィールドを用いることは全て同じ ・データの関連付けのレベル(粒度)が違う ・関連フィールドを設定するタイミングが違う データの関連付け - Tableau ①データブレンド②データ結合③リレーションシップ

      • 15.Tableau ServerとTableau Online

        今までずっと説明してきたのが、Tableau Desktop(分析ツール) これを使って、視覚化や分析用ダッシュボードを作成してきた ※インストール型のソフトウェア ※PCでデータの可視化、分析ができる 次の段階として、Tableau Desktopで作ったVizを共有したい が、これをそのままtwbxでレポート共有などしてしまうと、 ・毎回ダッシュボードを共有する必要がある  ⇒最新がどのダッシュボードかわからなくなる  ⇒共有後は管理管轄外となりセキュリティー対応ができ

        • 13.FIXED, INCLUDE, EXCLUDE:LOD計算

          ちょっと苦手意識が・・・ なので、しっかり向き合う 通常の集計はそもそもどうなっているか  SUM([売上]) ⇒ 227,176,841 ・・・・全部の合計①  COUNT([行Id]) ⇒ 10,000 ・・・・・全レコード数②  AVG([売上]) ⇒ 22,718 ・・・・・・①/② ⇒関数は「データソースの行レベル(1購入単位)」で集計が行われている  この集計に対して、集計の粒度を自由に変えられるのがLOD計算! LODとは、「Level of Detail」の

        14.計算順序がある?:クエリパイプライン

          11.IF, IIF, CASE:論理関数

          これもわからない。 IFとIIFの違いもわからない、のでメモ。 ①論理関数★CASE ★IF 一連の式をテストし、最初の真の <test> の <then> 値を返す ★IIF TrueかFalseの2択 条件が満たされているかどうかを確認し (<test>)、 テストが true の場合は<then> を返し、 テストが false の場合は <else> を返す テストが Null の場合は <unknown> のオプションの値を返す オプションの unk

          11.IF, IIF, CASE:論理関数

          12.その他メモしておきたい関数

          使うことが多いので、メモで残したい・・ Tableau で使用する関数 - Tableau より抜粋 ①日付関数DATEADD 日付部分 (月、日など) に指定された期間を開始日に加える 使い方: ・DATEADD ('week', 1, [日付]) ⇒ [日付]を1週間後にする ・DATEADD ('day', 280, #2/20/21#) ⇒ 2021 年 2 月 20 日の 280 日後 DATEDIFF 2 つの日付の差を日付部分 (週、年など) の数で返す

          12.その他メモしておきたい関数

          6.色・形・大きさ:ビジュアル分析

          いろいろ使ってみたくなるけれども、 どんな種類があって、どんな風に使うのかは知っておきたい・・・ ①Preattentive attributes??Preattentive Attribute=視覚的な属性(見てすぐにわかるもの)を使うことによって、自分では意識していないうちに瞬時に要素として判断できる。 視覚的な属性10種類 ・形に関するもの:長さ、幅、向き、サイズ、形状、囲い、 ・位置に関するもの:位置、グループ ・色に関するもの:色(色相)、色(彩度) この組み合

          6.色・形・大きさ:ビジュアル分析

          9.簡易表計算・・・:表計算関数①

          ・現在表示されている内容に基づいて「累計」や「差」を計算する ・簡易表計算は、表計算関数を自分で書かなくともできる表計算 ①簡易表計算の種類 ※プライマリ計算タイプ ・累計  ⇒ RUNNING_SUM([利益])  ※パーティション内の最初の行~現在の行の指定された式の累積合計  ※詳しくは別項参照(その他メモしておきたい関数) ・差 ♦  ⇒ 前の値:SUM([利益]) - LOOKUP(SUM([利益]), -1) ※初期値  ⇒ 次の値:SUM([利益])

          9.簡易表計算・・・:表計算関数①

          10.FIRST、LAST、LOOKUIP、INDEX、PREVIOUS_VALUE:表計算関数②

          これ、どういう風に使うものなのか・・・ 使えないので、使い方をメモ ①FIRST()・最初の行0、次の行から-1ずつ減少 ・最初の行から現在の行まで何行離れているかを返す関数  ※離れている行数のことをオフセットと呼称 ・この関数で行番号を振って他の表計算(LOOKUP等)に利用する LOOKUP LOOKUP(〇〇,オフセット) ・オフセット=-1 :去年度を参照 ・オフセット=0 :翌年度を参照 ・オフセット=FIRST() :初年度を参照 ・オフセット=LAST(

          10.FIRST、LAST、LOOKUIP、INDEX、PREVIOUS_VALUE:表計算関数②

          7.カウントと個別カウント?

          いつもごちゃごちゃになるので、 毎回一度数字を入れてみる・・・ これに、顧客名・製品名を入れて詳細をみてみる。 ①カウント(COUNT)・重複も含め、データの数を集計 ・オーダが出た回数 ②個別のカウント(COUNTD)・ユニークカウント ・重複は除いて、データの数を集計する ・オーダー人数

          7.カウントと個別カウント?

          8.集計と非集計:計算フィールド・・・

          「この関数の集計および非集計の引数を混在させることはできません。」 たとえば、利益率を出してみる ①集計/集計と非集計/非集計・・・集計同士:SUM([利益])/SUM([売上]) ⇒ 合計/合計 非集計同士:[利益]/[売上] ⇒全レコード1つ1つに対して利益/売上を計算し、それの合計になっている  ※オーダId1つ1つの合計なのですごい値に・・・ ②集計と非集計が混在できる計算異なるLOD(詳細レベル)の計算を混在させるための関数 LOD表現に関しては、別項で詳しく

          8.集計と非集計:計算フィールド・・・

          3.連続・不連続

          「連続」が緑色、「不連続」が青色。 色の違いはあくまでも、 ディメンションかメジャーではなく、「連続」「不連続」の違い。 ディメンションとメジャー、青と緑 - Tableau ①連続途切れることなく、切れ目のない全体を形作っている ビューに軸が形成される 1、2、3、4,5という数字のように、数字の順番が決まっているもの ※1と2の間には、1.5や1.99などがあり連続している 時間軸のように過去から未来へと連続して流れているもの 順番を変えることができない リフ

          3.連続・不連続

          2.ディメンションとメジャー

          ・ディメンション=いつ・どこで・だれが・なにを(項目) ・メジャー=計る(数字) これらを使って、 ①ディメンション:分類的定性的値 (名前、日付、理的データなど) が含まれる データの分類、区分、詳細の表示に利用できる ビューの詳細レベルに影響 基準をどこに置くのか?で考える 「メジャーネーム」はすべてのメジャーの名前が入っている 「形状」「色相」と視覚的相性が良い ②メジャー:量的測定可能な数値と定量的な値が含まれる デフォルトで集計される ビューにドラ

          2.ディメンションとメジャー

          5.ビジュアライゼーションに迷う

          データを前にして、どんなグラフを使うか迷う。 こんなグラフを作ってみたいと思うが、どうやって作るか悩む。 何を伝えたいか?いわゆるビジュアライゼーションを考える。 グラフを選ぶ①時系列推移をみたいとき ・折れ線グラフ(線)  ⇒時系列に沿った変化(連続的変化)や傾向を視覚化 ・エリアチャート【面グラフ】(エリア)  ⇒線と軸の間の面を色で網掛けし、全体的な属性毎の比率や総量を表現。   ※量が少なく変化が地裁データを下に配置 ・ステップチャート【階段グラフ】(線)  ⇒二

          5.ビジュアライゼーションに迷う

          4.グループ化・セット

          どちらも同じくグループ化することだと思うのだけど、 その使い分けは? ①グループとは・固定:いつでも同じ組み合わせで見る ・同一フィールド内の複数のメンバーを一つにまとめることができる 「データ」ペインからグループを作成  ⇒対象の項目を選択して右クリック⇒「作成」⇒「グループ」 「ビュー」からグループを作成 ※  ⇒グルーピングしたい値を選択して右クリック⇒「グループ」 ②セットとは・変動:指定した定義に当てはまるグループで見る ・ディメンションでつくる ・In/Out

          4.グループ化・セット

          1.接続のこと:ライブと抽出

          Tableauを開いて、データに接続する。 その時のこと。 ライブ接続 ・データソースに直接接続 ・リアルタイムデータ(データが更新されるたびに最新のデータを取得) ・ネットワーク接続が必要 ・アクセス時・操作時・グラフ作成時、都度負荷がかかる ・データベースやデータソースのパフォーマンスに依存 ・ワークブックのサイズは比較的小さい ・データソース自体が保持しているセキュリティ対策が適用 抽出接続 ・抽出のタイミングのみ負荷がかかる ・ある瞬間の定点データ(圧縮済スナ

          1.接続のこと:ライブと抽出