見出し画像

データ活用に必要なデータクレンジング

DX(デジタルトランスフォーメーション)の推進にしても、マーケティング活動にしても、広報活動にしても、重要なのはデータ活用です。

感覚に頼らず、データを分析して適切な意思決定やサービスの向上にのためには、対象となるデータの品質がとても大切です。

ところが、同じ組織の中でもデータの品質はバラバラで、化石化したものや入力規則があって無いようなものが多く混在していて、いざデータを統合しようと思っても、かなりの苦労を強いる可能性が高いのが実情ではないでしょうか。

常にデータの整理や整備が必要で、継続的な改善による維持が求められています。
そこで、データクレンジングが重要な役割を担うのです。


データクレンジングとは、データの欠損や重複、ノイズ、表記の揺れ、粒度の違いなどを特定し、分析や業務に適したデータに加工する工程です。

例えば、こちらです↓

略語:株式会社、(株)
単位:05.h、30min
全角半角:ABC、ABC
大文字小文字:ABC、abc
スペース:Asystem、A system
コード:男/女、男性/女性

データ名が一致していないと、同じ内容でも別の内容だと判断されるため、データの統一は、めちゃくちゃ大事なのです。

データの一貫性を保つ作業をデータクレンジングといい、データの品質を向上させるのです。

データの品質を高めたあとは、いよいよDX実現に向けて、これらに着手ですね ↓

・データをビジネス判断に用いる
・ビジョンを実現するための概念実証(PoC)
・データ活用を組織文化に

これらは、データの品質が高くなければ、実現することが難しいです。

DXの基礎となるデータクレンジング、ぜひ実践してみてください!



よろしければ、サポートお願いします! もっと分かりやすく、ビジネスの話題を提供できるよう、勉強資金に使わせていただきます。