機械学習と統計学の違いについて個人的に考えたこと

2024年3月17日 14:18

機械学習と統計学の違い・境目に関しては明確で一般的な定義があるわけではありません。

しかし統計学や機械学習を勉強していている内にある程度は傾向があるように思われたので、その内容を記載していきたいと思います。

機械学習では画像・音声・文字列、動画などのデータも扱いますがこれらは古典的な統計学では一般に扱われません。また強化学習の概念も古典的な統計学では一般に扱われません。

ログの記録というのがそもそも20世紀にはあまり存在しなかったためか、レコメンデーションの理論も統計学では登場しません。

かつて統計学の応用と言えば金融、医療、そして製造業における品質管理という印象を個人的に持っておりましたが、世の中のIT化、デジタル化が進み、従来の分野以外でも有用となる理論や技術が進化していったものと思われます。

機械学習では教師あり・なしの基準にこだわります。

「統計量の計算や仮説の検証を通したデータの特性の理解」よりも、「予測、分類、生成、行動などの高精度のモデルを構築すること」を主な目的としている傾向があります。

モデルのパラメータを決める(収束させる)学習の効率の良さ、必要な時間というのが機械学習ではかなり重視されます。

アルゴリズムやモデルといった単位で知識や理論をまとめて扱うことが増えます。モデルの選択基準も当然必要になります。

例えば、一般線形モデルを一般化させた一般化線形モデル(GLM)では従属変数は正規分布に従うとは限りません。

この記事が気に入ったらサポートをしてみませんか？