【AIって何だろう】機械学習とは?【2/5】
どうも、G検定攻略ガイド管理人です。
第2回のコラムは「機械学習」についてのコラムです。
前回の記事では「人工知能」という大きなくくりの中の話をしましたが、今回は「機械学習」という分野のお話をしたいと思います。
前回記事を読んでいない方は、こちらからどうぞ!
機械学習とは
それでは機械学習についてお話していきたいと思います。
機械学習とは「特徴をつかんで法則化し、その法則を自動化する」ことを目標としたコンピュータアルゴリズムのことをいいます。
この解釈が正しいかどうかはさておき、抽象的な概念としてはこの言い方が最もしっくりくる説明だと思っています。
それでは、機械学習は手法によっていくつかに分類することができます。これらを見てみましょう。
機械学習のジャンル
「教師あり学習」「教師なし学習」というのは、この分野の学習をしていると必ず出てくる言葉です。また、これ以外にも最近は「強化学習」と呼ばれる分野も積極的に研究されています。
基本的に、われわれが今の世界で目にする機械学習は上記の分類で区分されていると言って問題ないでしょう。
また、昨今は「ディープラーニング」と言われる分野が劇的に成長を遂げたため、独立した分野として研究対象になっていますが、実際は下記のように「人工知能>機械学習>深層学習」というような分野の包括関係になっています。
特徴量というキーワード
それでは、ここで「特徴量」というキーワードが出てきました。機械学習においては「特徴量」というものが非常に重要です。このキーワードに関しては、少し掘り下げて解説しようと思います。
特徴量は「対象となるデータを端的に表現できるような特徴を見つけ出すための変数」のことです。
これが機械学習、さらにディープラーニングにおいてもキーワードになってくるというのは前述したとおりです。
では、特徴量とは一体何なのでしょうか。
例として、東京ドームのビールの売り上げを予測するとしましょう。
多くの人は「そんなの気温が高い日は、たくさん売れるに決まっているじゃない」と思うかもしれません。
しかし、それは経験則でしかないのです。
本当に気温が高い日に、そのほかの日よりたくさんビールが売れることを、実際に示すことは難しいでしょう。
機械学習においては予測をするために、このように経験則に基づいたデータからモデルを作っていくのです。
当然、集めたデータを統計的に処理したりしてからモデルを作成するため、ある程度はデータの段階で相関が見えたりする場合も多いです。
そしてさらに進んだディープラーニングでは、この特徴量を見つけ出す作業もモデルにやらせてしまおうという考え方になっています。
上記の図のように、人間が作業する工程がひとつ減っていることになります。
しかし、従来の機械学習よりもディープラーニングのほうが一般的には計算処理が多いため、マシンパワーが必要になります。
もちろん簡単な分類問題であれば、自宅のコンピュータ環境でも動かすことができますので勉強してみるのもいいでしょう。
次回へ続く
さて、いかがだったでしょうか。
今回は「機械学習」の大枠についてお話させていただきました。
G検定攻略ガイドでは「ディープラーニングG検定」の攻略に役立つ情報を発信しています。
下記リンクより、ぜひ別の記事も読んでいただけると嬉しいです。
ここまで読んでいただき、ありがとうございました。
よろしければサポートをお願いいたします。 記事・コンテンツ作成のモチベーションになります。