Rを活用した地域課題解決のためのヒント NDB分析編 #6-10の予告(特定健診)
特定健診データの機械学習について#6から特定健診データ(及び質問票)の機械学習(ML:Machine Learning)を事例を交えてやってみたいと思います。
機械学習は大別して、教師データなし学習と教師データあり学習があります。教師データなし学習としては、クラスター分析(クラスタリング)、主成分分析、因子分析などを、教師データあり学習としては、相関分析、多変量回帰分析(重回帰分析)、決定木(応用としてランダムフォレスト)などを予定しています。
教師データ(正解となるデータ)