見出し画像

100日後にプロになるワシ20日目(Python)

前回。引っ越し数を予測する機械学習モデルを作成するも、結果ダメダメだったので、また別の機械学習の勉強を始めることにしました。

今回は「賃貸物件の家賃推定」
データはこんな感じ↓

カラム名	説明
id	物件ID
家賃	家賃(目的変数)
所在地	住所
アクセス	最寄りの路線等
間取り	間取り
築年数	築年数
方角	方角
面積	面積
所在階	物件自体の階数と物件がある建物の総階数
バス・トイレ	バス・トイレの建てつけ等
キッチン	キッチンの建てつけ等
放送・通信	通信設備の建てつけ等
室内設備	室内設備の建てつけ等
駐車場	駐車場の有無等
周辺環境	最寄りのスーパー等
建築構造	建築構造
契約期間	契約期間 (2019年8月が起点となります)

けっこうおおいな。。。

とりあえずこれを分析して、家賃を予測できるようにします。

まずはデータの読み込み

スクリーンショット 2020-09-01 8.32.33

これもまだソラではかけないかも

築年数のデータは「7年5ヶ月」や「新築」のように文字列なので
分析するために数値に変換する必要がある。
なので、「7年5ヶ月」は最初の7を「新築」の場合は0に変換したい。

そのため、変換するための関数を用意して、
その関数を使ってdataframeに実行する。

スクリーンショット 2020-09-01 8.45.39

データ整形のために関数を用意するパターンは初めて
(目からウロコ落ちました)

スクリーンショット 2020-09-01 8.45.54

実行結果↑

うまいこと言ってそう。

こんな感じで進めていきます。
(別の記事書いて時間がないので今日はここまで╭( ・ㅂ・)و ̑̑ グッ !)

感想

基本的にSIGNATEの機械学習のプロジェクトははじめに全体を通しての流れの説明がありますが、今回。前回のECサイトの分析よりかなり丁寧な印象。

サムネにしている画像もその流れを説明する動画から。
データの種類とか前回全然考えてなかったので、そう言うのも今回は意識してできたらいいと思う。

蛇足

なんか100日でPythonとか言ってるけど、
以外に身につかないものなので分野絞った方がいいかも。

100日で機械学習マスターとか。。。(マスターは大げさか笑)

いつもサポートありがとうございます。 難しい方は感想をコメントでいただけると嬉しいです。