第1回 ぼっちぜみ

第1章 序論

・パターン認識とは何か
・機械学習とは何か

今回はこのあたりをまとめる。

パターン認識とは何か

 そもそもパターンは物理学にふるくからなじみのある分野で、ケプラーは天体観測のたくさんのデータに基づいて経験則から天体の運動に関する法則を発見した。特にパターンが広く広まったのは計算機が広まってからであり、パターン形成を計算機を用いて再現しようとされた。いまでは、非線形物理学のひとつとして、パターンは取り扱われている。
 パターン認識では、データの規則性を計算機を用いて自動で見つけ出し、データを異なるカテゴリに分類するといったデータ処理を行うことに関連する。

機械学習とは何か

 機械学習においては、特に3つのデータが重要になる。

1.入力ベクトル(訓練集合)= x
  :入力するデータの集まり
2.目標ベクトル(目標値)= t
  :入力するデータに1対1に対応するカテゴリの集まり
3.出力 = y
  :機械学習のアルゴリズムによって得られる関数

出力 y は入力ベクトルに基づいて求められる。これを訓練・学習と呼ぶ。
 訓練で用いたデータと異なるデータ(種類は同じ)をテスト集合と呼び、テスト集合を分類する能力を汎化と呼ぶ。

 機械学習では、訓練に用いるデータによって学習が一般的に分類されている。

・教師あり学習
  :訓練データが入力ベクトルと目標ベクトル
   例)クラス分類・回帰分析
・教師なし学習
  :訓練データのみ
   例)クラスタリング・密度推定
・強化学習
  :初期値に対して報酬を最大にする

強化学習に関してはほとんど分からないのでいずれ勉強したいですね。

あとがき
 
実際はもう少し先までやってはいるのですが、いかんせんnoteでは数式が入れられないので。うまく画像とか使ってまとめていくか……あとはpdfのっけたりしながらなんとか対策を練ってみよう。

この記事が気に入ったらサポートをしてみませんか?