見出し画像

データの組み合わせ方

私がDATA Saber Bridgeに参加している中で、特に苦戦した複数のデータを組み合わせる方法についてまとめてみました。

◦結合
共通するフィールドに一致する値でひも付けて、データを横につなぎ合わせる手法。
 ・内部結合:共通する値だけを含む
 ・左結合:左側の値は全て含み、右側は共通する値のみ含む
 ・右結合:右側の値は全て含み、左側は共通する値のみ含む
 ・完全外部結合:左右全ての値を含む  

◦ブレンド
それぞれ集計結果をまとめて、同じビューに表示する手法。データの粒度が異なる場合も使用可。最初にドッロプしたデータを左にした、左結合。

◦リレーションシップ
(バージョン2022.2で追加)
複数のデータを組み合わせた分析。結合とブレンドの代わりに使用。必要なテーブルのみクエリするため、多くのデータを組み合わせることが可能。

◦ユニオン
複数のデータを縦につなぎ合わせる手法。
同じデータの持ち方をする複数のデータをまとめるときに使用。

この記事が気に入ったらサポートをしてみませんか?