データマイニングって知ってる?
突然ですが、
データマイニングってなんだか知っていますか?
「何だよそんな横文字バッカリ・・・」
なんて思った人もいるかもしれませんが、
実は、私もまったく知りませんでした(笑)
先日、学校課題でデータマイニングについて記事を書けという課題が出されるまではデータマイニングのでの字も知りませんでした。
そんな自分が、一週間ほど頑張って知らべたので、
是非最後まで見てくださるとうれしいです(笑)
➊まず、データマイニングってなに?
データマイニングとは、
簡単に言うと、
「大量のデータを様々な方法を用いて必要な知識を見出す作業」
です。
その言葉通り、
データ(情報)から有益なものを採掘(マイニング)することです。
近年では、ビッグデータが注目されていますが、それに伴ってビッグデータを有効活用するためのデータマイニングも同時に注目されるようになりました。
❷データマイニングの仕組みとやり方
*データマイニングの仕組み*
そもそもデータマイニングをする意味とはなんでしょう?
例えば、
ある企業が商品の並べ方と売り上げの関係についてデータマイニングしたところ、
[商品Aと商品Bを並べて売ったときの売り上げがよかった]
という結果がでてきたとすると、
その結果を基にして生産効率を上げることができるでしょう。
*データマイニングのやり方*
_人人人人人人人人人人人人人人人_
>準備→機械学習or統計分析(3手法)<
 ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^ ̄
https://static.it-trend.jp/img/data_mining/article/explain/data_mining_explain_img02.jpg
<準備>
データマイニングを行う準備として、
第一にデータを大量に集めなければなりません。
これは多ければ多いほどメリットが大きいです。
そのため、DWH(データウェアハウス)という名の情報の倉庫を設ける場合もあります。
第二に、その集めたデータを加工(クレンジング)します。
データマイニング自体は、
"コンピューター上の場合が多い"
ので、システム上で使用可能な状態に加工します。
<マイニング>
機械学習・・・簡単に言うと人口知能を利用することです。
人工知能を利用するメリットは、
自分で学習して相関関係などを導くので、
人にはできない、新しい分類ができたりします。
ここでは、本来必要な「仮説」をたてる工程が要りません。
統計分析・・・このやり方は、基本的に三つのやり方があります。
一つ目は、クラスタリングです。
これは購買データから似たような行動をしている人をグルー ピングして、グループごとに施策を打つことです。
二つ目は、ロジスティック回帰分析です。
これは「はい」「いいえ」を明確に定義できるものの予測に
役立ちます。
三つ目は、マーケット・バスケット分析です。
これは製品やサービスの相関性を見つける手法です。
例えば、「おむつとビールを一緒に売る」と売り上げが上がった
という事例があります。
*最後に*
ここまでご覧いただきありがとうございます!
データマイニングツールを活用すれば、これまで重要視されていなかったデータにも光を当てられます。
例えば、ショッピングモール内の温度、湿度、照明光度と売上との関係から売り上げを上げることができるでしょう。
参考:https://it-trend.jp/data_mining/article/explain
この記事が気に入ったらサポートをしてみませんか?