2-1.機械学習の基礎(学習法)
機械学習の学習法の種類は、大きく分けて「教師あり学習」「教師なし学習」「強化学習」の3つに分類されます。データ活用の目的に応じて、適切な手法を選ぶことが重要となります。
①教師あり学習
②教師なし学習
③強化学習
さらに追加で以下の論点も重要となります。
④データの前処理
⑤特徴量
‐ 欠損時の対応
⑥One-Hotエンコーディング
⑦多重共線性
⑧ホールドアウト法
⑨アンサンブル学習
①教師あり学習
「教師あり学習」は、学習データに正解をあたえた状態で学習させる手法です。学習データに正解をあたえない「教師なし学習」とは対極にある機械学習の手法となります。
教師あり学習では、トレーニングデータや教師データなどと呼ばれる正解となる学習データが利用されます。そのため、正解・不正解が明確な問題の解決に利用されます。教師あり学習で利用されるアルゴリズムとしては、回帰と分類が代表例となります。
<回帰と分類の例>
回帰…株価の予測や気象分析などに利用
分類…食べ物や動物などのカテゴライズなどを実現
一般的に、教師あり学習は、学習と認識・予測の2段階のプロセスで構成されており、ディープラーニングは、教師あり学習を発展させたものと考えられます。
教師あり学習では、特徴量と正解ラベル(教師ラベル)の間の関係性を見出し、予測値を正解ラベルに近づけるようにモデルが学習します。
②教師なし学習
教師なし学習は、学習データに正解を与えない状態で学習させる手法となります。教師なし学習では、予測や判定の対象となる正解が存在しないため、当然、教師あり学習とは異なり、回帰や分類が必要となる問題には対応できません。
教師なし学習が利用される代表的な例は「クラスタリング」と「次元削減」です。クラスタリングは、データの特徴からグルーピングすることであり、例えば赤、青、白という特徴を持つコップが無造作に配置されていた場合、人間であれば、赤グループ・青グループ・白グループとグルーピングすることができます。教師なし学習のクラスタリングを用いることで、コンピュータが自動的にグルーピングすることが可能となります。
この記事が気に入ったらサポートをしてみませんか?