初投稿:自己紹介&SIGNATE挑戦開始

こんにちは。Kosukeです。
最初に自己紹介します。

自己紹介

・性別:男
・所属:大学3年生
・興味:映画、音楽(邦ロックと洋楽)、旅行、ちいかわ好き

SIGNATE挑戦

機械学習を学ぶにあたってデータ解析または予測を実践するため、コンペティションに挑戦しています。
まずはSIGNATEに登録して、Learningにてコンペティションで必須となる機械学習手法を習得しました。
習得した機械学習手法を用いて練習として自動車の走行距離予測のモデルを作成しました。

挑戦開始

概要

ガソリン1ガロン当たりの走行距離の予測モデルを行いました。

データ準備

まず、以下のサイトでデータの確認を行い、次にtrain.tsvとtest.tsvのダウンロードを行いました。

プログラム実行

まず、必要なライブラリをインポートし、ダウンロードしたファイルの確認を行う。
次、訓練データの目的変数と説明変数同士の相関を求め、使用する説明変数を決めた。排気量と重量、加速度、年式が1ガロン当たりの走行距離と相関を持っていた。従ってこの4つを使用する。説明変数を2つ以上なので重回帰モデルを作る。
さらに、それぞれの説明変数の大きさによる傾きと切片を求めてモデル作成を行った。
最後に、重回帰予測モデルを作成し、テストデータに走行距離の予測を予測し、提出データに書き込んだ。

結果

切片と傾きを求めた結果、model yearにmpgが他の3つの変数に比べて左右される。また、cylindersとdisplacement, weightが増えるごとに、mpgは減少すると考えられる。

あとがき

以上、コンペティションに参加する練習を行いました。この経験を活かして他の問題を用いて練習を行うことを考えています。

#Python #機械学習 #初投稿  

この記事が気に入ったらサポートをしてみませんか?