スクリーンショット_2019-07-24_09

なぜ機械学習がうまくいかないのか - 2.データの準備が不十分

「弊社は多くのデータがあるから機械学習をしたい」みたいな話はよく聞きますが、データが多いからと言って機械学習に適しているとは限りません。

機械学習に適さないデータ構造になっていれば、当然機械学習も失敗します。かと言っても専門家でなければ見極めはできないものですよね。

ここでは機械学習に適したデータの条件を説明します。

誰に向けて書いたか

・ 仕事で機械学習を扱う初心者
・ 知識はないけど仕事で使うことになったマネージャ

読んでも意味がない人

・ 機械学習プロジェクトの経験者(熟練者には当たり前のことが書かれています)

そもそも機械学習ってどうやるの?

一般的に広く用いられる機械学習手法は”教師あり学習”と言って、データに対して答えを与えて、その答えとの関連性を捉えて学習をします。

ここでは”教師あり学習”の方法を解説していきます。

例えば犬の画像を与えて犬を識別させたい場合は、犬の画像と「犬」という答え(正解データ)を与える必要があります。

ただし機械学習を行う際は使用するデータを

・ 学習に使う訓練データ
・ 本当に予測できるかを検証に使うテストデータ

の二つに分ける必要があります

適したデータの条件とは?機械学習をする前のデータチェックリスト

ここから先は

2,850字

¥ 300

この記事が気に入ったらサポートをしてみませんか?