見出し画像

【DCCR】2-1-2_最終出力結果を見据えてデータの整理をする

DCCRモデルにおいて最初に行うことは、最終的な出力結果を見据えて必要なデータを整理することでした。こうすることで、後続の計算シートの作成がスムーズに行える効果があります。

ではまず最終的に出力したいデータの形式を確認します。具体的に言うなら、このExcelファイルで作成したデータを何にしようしたいのか、そしてどのようなデータを、どのような形式で得たいのかを確認します。
例えばExcelでデータを加工する目的は、他のシステムに取り込むデータの作成であったり、会議資料で使用するデータのとりまとめ、日々のKPIを整理するデータの管理などがあります。
ここで注目すべきは、Excelで加工したデータを使う先がどのようなデータ形式とデータの種類を期待しているかを確定させることです。ここを疎かにすると、必要なデータや計算過程が変わってしまい、作り直しになってしまいます。

次にデータを列ごとに、どのようなデータがあり、それがどこから得られるのかを整理します。
例えばECサイトの売上一覧を商品カテゴリごとに整理しようとします。売上一覧には商品IDのほか、商品名、カテゴリID、数量、単価、取引日時があったとします。この状態ではカテゴリIDは分かっても、カテゴリ名が分かりません。
そのため最終的に[取引日, 商品名, カテゴリ名, 売上合計]といったデータを出力したいのであれば、売上一覧の他にカテゴリ一覧が必要になるということが分かります。

ここで注意したい点として、データは基本的にシステムが吐き出すデータをそのまま利用することです。よくやってしまうのが、他のExcelで加工したデータをインプットとして使用するケースです。
このExcelのために前処理として専用で作成したExcelファイルからのアウトプットであれば良いのですが、別の用途でも使用しているExcelファイルの場合はアウトプットのデータ形式が変わってしまう恐れがあります。
もちろんシステムで管理できておらず、Excelファイル上にしかないデータなどであればそれは例外です。一方で、それらのファイルはなるべくデータ形式を変更せず安全に管理する必要があります。

次にデータの加工に必要な設定シートの必要性を検討します。例えば新規商品の追加や、ユーザーの設定変更など、これまでにないデータを追加して新しいデータを出力することもあります。
そのため、どのようなデータが追加で必要なのかを確認してください。

以上の3つのポイントに沿って、最終的な出力結果から始めて必要なデータを整理することができます。

この記事が気に入ったらサポートをしてみませんか?