Tableau Prep 備忘録 ③複数の同型シートを集計するとき
ちょっとnoteを書くことすら忘れていた今日この頃ですが・・・
今日は複数の同型のシートを集計する際のちょっとしたTipsを。
業務でエクセルの雛形に記入されたファイル(月150枚、2000行くらい)を集計しているのですが、誰かが昔作ったマクロが絶滅しかかっていて、
Prepへの集計フローの置き換えをやっています。
よくある問題は
・雛形を変えてくる人がいてうまく集計できない
・雛形の項目数や項目名が変わってしまう
みたいなケースです。
読み込み時に設定していたフィールド(項目)の削除が適応されなくなったり、例外ごみデータが混ざってしまったりします。。。
そんな問題の対処に、今のところ私のおススメは
読み込み方の工夫(2パターン)です。
■事前準備
いずれも集計はしないけど、形は同じ【雛形】(データ型を合わせたサンプル値1行が入っているほうがいいです)を準備しておきます。
お洋服を発注するための見積書?みたいなサンプルを作ってみました。
今回は雛形と集計する見積書ファイル5つが同じフォルダに入っています。
①雛形(template)に集計するファイルをユニオンして読み込む
まず、雛形(template)を読み込み・・・
次に、【テーブル】→【複数のテーブルをユニオン】で集計したいファイルをユニオンして読み込みます。
あとはFilePathsから雛形(template)を除外すれば完成です。
②雛形(template)とは別に集計するファイルをユニオンで読み込み、ユニオンする
やはり最初に雛形(template)を読み込み・・・
次に、集計したいファイルをユニオンして読み込みます。
2つをユニオンして、雛形(template)を除外すれば完成です。
①のケースではフィールド(項目)のフィルタは読み込み時に、
②のケースでは読み込み後の最初のクリーニングステップで
不要なフィールド(項目)を削除します。
今のところ、あんまり形が変わらないものは①、まぁまぁ変わるものは②の方法で読み込んでいます。
早く入力からシステム化されるといいんですが・・・