データマイニングについて...
最近「ビッグデータ」が世界中で注目されている中、これを有効活用する方法として「データマイニング」にも注目がされています。「聞いたことはあるけどよくわからない」や、そもそも「データマイニングなんて聞いたことないよ」という方はぜひ参考にしてください。
1.データマイニングとは
データマイニングとは、「沢山ある情報を統計学や人工知能などの技術を利用して傾向やパターンを見つけ出す方法」ということです。簡単に説明するとデータマイニングという名の通り、情報(データ)から利益になるものを採掘(マイニング)することです。
買い手がどんな商品をいつ買ったか(購買行動)などのデータを分析することで、「この商品はこのぐらい売れる」などの購入率の予想や「この商品と顧客にはこんな関連性がある」などの発見などに使用されます。
2.データマイニングで得られること
実際にデータマイニングを行うことで得られる情報は下記の4つに分類されます。
I データ(Data):整理されていない情報
Ⅱ 情報(Information):データを何かの基準によって整理したもの
Ⅲ 知識(Knowledge):情報から得ることのできる知見や傾向
Ⅳ 知恵(Wisdom):人が知識を使って判断する力
データマイニングは知識を発見することまでしか行えません。よって最終的にその知識を利用するためには、人が考え、判断する必要があるのです。実際にデータマイニングを行って出た知識が有益なのかは判断するまでは分からないということです。ちなみに、上記の分類を4つの頭文字をとってDIKWモデルと呼ばれています。
3.データマイニングの種類
データマイニングは主に「仮説検証」と「知識発見」に分けられます。 「仮説検証」とは購入される量や反応を予測するなど、検証したいことを解決するためにデータを集めて分析することです。それに対して「知識発見」は集められたデータから利用できそうな傾向・パターンや類似している点を発見しようとするものです。
4.データマイニングの方法・手順
それでは実際にデータマイニングを行う際の手順を説明します。
Ⅰ 目的に合ったデータを収集する
データマイニングを行う際には、データが無いのでは話になりません。一般的にはデータがあればあるだけ有益な情報を発見できますが、かといって「とりあえずビッグデータがあるから大丈夫」というわけではありません。データマイニングをより効果的に行うためには、目的に合ったデータを集めることが必要なのです。
Ⅱ 集めたデータを加工する
集められたデータはそのままでは使うことができません。データマイニングは大抵コンピューターシステムを使ってで行うため、データをシステム上で使えるように加工するなどの「クレンジング」が必要になってきます。この作業はデータマイニングを効果的に行うにあたって、とても重要な作業になってきます。
Ⅲ 分析する
ここでは「クラスタリング」「ロジスティック回帰分析」「マーケットバスケット分析」などを用いて傾向を見つけたりグループ化などを行います。それぞれの解析方法を簡単に言うと、「クラスタリング」はデータを類似している点に基づいて分類する方法 「ロジスティック回帰分析」は「YES」と「NO」が明確に定義できるものを分析する時に有効な方法 「マーケットバスケット分析」は商品やサービスとの関連性を発見する方法です。
Ⅳ 検証し評価する
分析したら終了ではなく、なぜそのような結果になったのか原因理由を考えます。その後、結果から考えられる規則性やルールを考えて、それが正しいかどうかをデータに当てはめてみて検証してみる。これでようやくデータマイニングが完了します。
5.まとめ
このようにデータマイニングを使うことによって今まで知らなかったルールや知識を得ることができます。上手くマーケティングに活かすことができればさらなるビジネスの加速・発達につながるかもしれません。
参考文献
データマイニングとは | 分析手法と手順、意味やできることを解説 (Ledge.ai)
https://ledge.ai/data-mining/
データマイニングとは?基本から分析手法までを解説! (ITトレンド)
https://it-trend.jp/data_mining/article/explain
Basic Knowledge on Data Analysis データ分析基礎知識 > データマイニング > データマイニングの基礎 > データマイニングとは(株式会社ALBERT)
https://www.albert2005.co.jp/knowledge/data_mining/data_mining_basics/about_data_mining
この記事が気に入ったらサポートをしてみませんか?