見出し画像

数のヨミカキ日記 #10 2022年3月14日(月)

~定型フォーマットで効率化~

【本日のデータ関連業務】

 データ処理・集計作業が複数あり、やや多忙。その中でも、最も時間を使ったD社作業についての日記。
通販会社D社のデータ整理作業 その3
概要:データのとりまとめ作業
   #8、#9で紹介した作業の最終工程
利用ツール:エクセル
所要時間:3.5時間前後

【作業概要】

●とりまとめフォーマットの最終調整
 先週(#9参照)作成したフォーマットにデータを取り込み、集計結果や出力形式に誤り・問題がないか確認(テスト)作業。
●データ集計
 以下の作業手順を繰り返すことで表を量産
①集計用データを当該箇所にコピペ
 元データは、時間帯別入電データ1ヶ月分
 24時間×31日分(28~31日分)
②ピポットテーブルで自動計算
 「更新」処理で、集計結果が自動更新
③提出レポート(表)の作成
 ピポットテーブルの自動更新 ⇒ 印刷レイアウトも自動で完了
 18枚の表をA4用紙 2枚にプリントアウト可能
●6ヶ月分の入電数データを作成
 ①から③を6ヶ月分(6回)実施する
 108枚の表(18枚×6ヶ月分)の完成
●表の傾向を分析 

【作業についての所感など】

 今回使用したフォーマットは3年以上にわたり改良を重ね、現在の形になっている。コピペ作業や、曜日の変更・確認などは必要だが、当初よりもかなり効率的なフォーマットに進化した。
 特に、ピポットテーブルは、データを入れ替えると列幅が自動的に変わってしまうため、その修正が面倒であった。試行錯誤の末、この問題を解決することができ、さらに効率化できた。
 もともと、このフォーマットはB社用に開発したものであるが、現在までに4社のクライアントで使用している。

 今回は6ヶ月分の集計作業を実施したが、3ヶ月目の処理中にバグ(セルの参照ミス)が発覚し、最初からやり直すことになった。チェック作業を入念に行ったこともあり、当初予定の予定の2倍以上の時間がかかってしまった。

【つぶやき】

 データ分析は「再現性」が求められる。
 再現性とは、"同じデータを同じように処理した場合、同じ結果が得られる”ことである。当たり前のことであるが、難しい側面もあり、再現性が怪しい集計や分析を目にすることも少なくない。
 
 今回使用しているフォーマットは、長期間にわたり改善を重ねて来た。ファイルの履歴の残し方なども含め細かい部分までルールがあり、再現性のある手順が整っている。このおかげで、ミスが起きても大きな混乱や焦りなどはなく対応することができた。余計な時間を使ってしまったことは反省点であるが。


この記事が気に入ったらサポートをしてみませんか?