なぜ機械学習がうまくいかないのか - 2.データの準備が不十分
「弊社は多くのデータがあるから機械学習をしたい」みたいな話はよく聞きますが、データが多いからと言って機械学習に適しているとは限りません。
機械学習に適さないデータ構造になっていれば、当然機械学習も失敗します。かと言っても専門家でなければ見極めはできないものですよね。
ここでは機械学習に適したデータの条件を説明します。
誰に向けて書いたか
・ 仕事で機械学習を扱う初心者
・ 知識はないけど仕事で使うことになったマネージャ
読んでも意味がない人
・ 機械学習プロジェクトの経験者(熟練者には当たり前のことが書かれています)
そもそも機械学習ってどうやるの?
一般的に広く用いられる機械学習手法は”教師あり学習”と言って、データに対して答えを与えて、その答えとの関連性を捉えて学習をします。
ここでは”教師あり学習”の方法を解説していきます。
例えば犬の画像を与えて犬を識別させたい場合は、犬の画像と「犬」という答え(正解データ)を与える必要があります。
ただし機械学習を行う際は使用するデータを
・ 学習に使う訓練データ
・ 本当に予測できるかを検証に使うテストデータ
の二つに分ける必要があります
適したデータの条件とは?機械学習をする前のデータチェックリスト
ここから先は
2,850字
¥ 300
この記事が気に入ったらサポートをしてみませんか?