見出し画像

機械学習の種類について

機械学習の種類とアプローチついて

機械学習とは、私たちが解きたいさまざまな課題に対する一つの強力なツールです。しかし、それは全ての課題に対する魔法の杖ではありません。機械学習もまた、それがうまく機能する問題とそうでない問題があります。それゆえ、どのような問題が機械学習を用いて解決できるのか(あるいは少なくとも試みることができるのか)を理解しておくことが重要です。

課題自体は千差万別でありますが、その中には共通する構造を持つものが多くあります。これは機械学習のアプローチを次の3つに分類できることからも明らかです。

1. 教師あり学習

教師あり学習は、具体的な答え(ラベル)が与えられたデータから学習する方法です。例えば、手書きの数字を認識するシステムを訓練する場合、教師あり学習では、各手書き数字画像(入力)とそれが何の数字であるか(ラベル)を組にして学習します。

2. 教師なし学習

一方、教師なし学習では、ラベルが与えられないデータからパターンを見つけ出します。これは、たとえば、顧客の購買履歴から類似の傾向を持つグループを見つける(クラスタリング)などの問題に対して使われます。

3. 強化学習

最後に、強化学習は、エージェントが環境と相互作用しながら最適な行動を学習する方法です。これは、試行錯誤を通じて、ある目標(報酬)を最大化するような行動を探求します。チェスや囲碁のAIがこれを利用しています。

以上の3つが機械学習の主要なアプローチです。問題の種類や特性に応じて最適な学習方法を選択することが、重要となります。

教師あり学習について

教師あり学習とは

教師あり学習とは、「与えられたデータ(入力)を元に、そのデータがどんなパターン(出力)になるかを識別・予測する」手法です。具体的な例を見てみましょう。

  1. 過去の売上から、将来の売上を予測したい

  2. 与えられた動物の画像が、何の動物かを識別したい

これらの例は教師あり学習の代表的な問題です。更に別の例として、「英語の文章が与えられたときに、それを日本語の文章に翻訳したい」というものもあります。「英語に対応する日本語のパターンを予測する」と考えれば、これも教師あり学習の一部と言えます。

つまり、教師あり学習とは「入力と出力の間にどのような関係があるのかを学習する」手法と言えます。

回帰問題と分類問題

教師あり学習の問題をさらに細分化すると、「回帰問題」と「分類問題」の2つに分けることができます。

  1. 回帰問題: 連続する値を予測する問題を指します。例えば、将来の売上の予測などが該当します。売上は連続する値(数値)として表されます。

  2. 分類問題: 離散的なカテゴリを予測する問題を指します。例えば、与えられた動物の画像が何の動物かを識別する場合などが該当します。動物の種類は連続していない値(カテゴリ)として表されます。

教師あり学習では、これらの問題を解くための様々な手法が提供されています。問題の性質に応じて適切な手法を選択することが求められます。

教師なし学習について

教師なし学習とは

教師あり学習は入力と出力がセットとなったデータを用いますが、教師なし学習では、出力のデータはありません。つまり、「教師」とは出力データのことを指します。これが「教師なし」学習の名前の由来です。

教師なし学習の目的

では、教師なし学習では何を学習するのかと言うと、入力データそのものが持つ構造や特徴が対象となります。具体的な例を挙げてみましょう。

  1. 顧客層の認識:例えば、ECサイトの売上データから、どのような顧客層が存在するのかを認識するために教師なし学習を用いることができます。教師なし学習の一種であるクラスタリングを用いて、顧客を似た特性を持つグループに分けることができます。

  2. 項目間の関係性の把握:入力データの各項目間にある関係性を把握するためにも教師なし学習を用いることがあります。例えば、アソシエーションルールという手法を用いて、商品Aを買う顧客が商品Bも買いやすいというような関係性を見つけ出すことができます。

これらのように、教師なし学習は出力データがない場合や、データの内在する構造や特徴を探求するために用いられます。

強化学習について

強化学習とは

強化学習とは、「行動を学習する仕組み」を指します。具体的には、ある環境下で、目的とする報酬(スコア)を最大化するためにどのような行動をとっていけば良いかを学習していくことを指します。

強化学習の具体例:自動運転

自動運転技術は、強化学習の一例として挙げられます。強化学習の枠組みを自動運転に当てはめてみましょう。

  1. エージェント:自動運転する車

  2. 環境:車が置かれている環境(道路、交通状況など)

車の周囲の状態(他の人や車、信号の状態など)が「環境」からエージェントへフィードバックされます。そして、エージェントはその状態からどうすべきか(走るか止まるか、直進か曲がるかなど)を判断し、実際の行動をとります。その行動により環境が変化し、その新たな状態が再度エージェントにフィードバックされます。

さらに重要なのは、「報酬」です。エージェントがどれだけ良い行動をとったのかを評価する報酬(スコア)がフィードバックされることで、エージェントはより高い報酬が得られる行動をとるように学習を進めます。

強化学習の位置付け

教師あり学習、教師なし学習、強化学習は、それぞれ対象とする課題の種類が異なります。これらの手法の優劣を比較することはありません。各手法は単純に問題や目的に応じて使い分けられます。それぞれの手法が持つ特性を理解し、適切な課題に適切な手法を適用することが大切です。

この記事が気に入ったらサポートをしてみませんか?