機械学習と統計学の違いについて個人的に考えたこと
機械学習と統計学の違い・境目に関しては明確で一般的な定義があるわけではありません。
しかし統計学や機械学習を勉強していている内にある程度は傾向があるように思われたので、その内容を記載していきたいと思います。
扱うデータが変わり、応用される分野が増える
機械学習では画像・音声・文字列、動画などのデータも扱いますがこれらは古典的な統計学では一般に扱われません。また強化学習の概念も古典的な統計学では一般に扱われません。
ログの記録というのがそもそも20世紀にはあまり存在しなかったためか、レコメンデーションの理論も統計学では登場しません。
かつて統計学の応用と言えば金融、医療、そして製造業における品質管理という印象を個人的に持っておりましたが、世の中のIT化、デジタル化が進み、従来の分野以外でも有用となる理論や技術が進化していったものと思われます。
理論の分類基準が変わる
機械学習では教師あり・なしの基準にこだわります。
目的が変わる
「統計量の計算や仮説の検証を通したデータの特性の理解」よりも、「予測、分類、生成、行動などの高精度のモデルを構築すること」を主な目的としている傾向があります。
処理(学習)の効率を重視する
モデルのパラメータを決める(収束させる)学習の効率の良さ、必要な時間というのが機械学習ではかなり重視されます。
知識のまとまりの単位が変わる
アルゴリズムやモデルといった単位で知識や理論をまとめて扱うことが増えます。モデルの選択基準も当然必要になります。
「正規分布に従う」という仮定が減る
例えば、一般線形モデルを一般化させた一般化線形モデル(GLM)では従属変数は正規分布に従うとは限りません。
この記事が気に入ったらサポートをしてみませんか?