見出し画像

3-2.機械学習の具体的な手法の補足 (予測モデルおよび予測結果の評価)

予測モデルおよび予測結果の評価
(教師データと評価データに分割して検証する交差検証法)

教師あり学習では、収集したデータを教師データ(学習データ)と評価データの2つに分けて学習を行います。このようにデータを分割して評価することを「交差検証法(クロスバリデーション)」と呼びます。交差検証法の代表的な手法としては、「K分割法」と「ホールドアウト法」があります。

①K分割法
②ホールドアウト法
③オッカムの剃刀
④正則化
‐ElasticNet
⑤データリーケージ

①K分割法

K分割法は、学習データをいくつか(k個)に分割してモデル構築と検証を分割したデータの回数分(k回)繰り返す交差検証方法です。分割したデータ群のうちの1つを検証用とし、残りのデータでモデル構築を行います。1つを検証用として、残りのデータで構築したモデルの当てはまり具合を見て、1回目の結果を確認し、2回目は、別のデータを検証用として、残りのデータでモデル構築を行い・・・というように、分割したデータの個数分だけモデル構築と検証を行い、複数回(k回)繰り返し実施した検証の平均値を結果とします。

これは、異なるデータを検証用として複数回(k回)試行することにより、特定のデータのみに適合したモデルになってしまうことを防ぎます。

②ホールドアウト法

ホールドアウト法とは、モデルの精度を確認するための手法の一つで、1つのデータセットを教師データと評価データに分けて行います。モデルの精度に影響を及ぼしてしまうため教師データと評価データは、必ず分けて実施する必要があります。ホールドアウト法では、教師データに使用したデータを評価データとして使うことはありません。逆に、評価データとして使用したデータを教師データに用いることもありません。ホールドアウト法を用い
る場合には、データが混同しないように注意することが必要です。

ここから先は

670字 / 1画像
随時情報を更新していきますので、G検定対策だけでなく、そもそもAIって何なのという疑問も解決します。 G検定対策はこれだけで十分です。

G検定対策として、現役トップデータサイエンティスト兼経営コンサルタント集団がマガジンを発行しました。

この記事が気に入ったらチップで応援してみませんか?