見出し画像

ボストンにおける家賃に対する重要ファクター予測

コロナで都心から脱出」、みたいな話を良くテレビでやっていますよね。

実際にわずかに人口は他県に流出している、という話はあるそうです。

ところが、、、なんと都心の価格は安くなっていない!

実は、逆に良好な立地の物件の値段はバク上がりしているようなんです。

「都心回帰」の流れが顕著になってきているんですね。

そういった資産に関係する技術を最近PropTechと呼ぶらしいのですが、そのPropTechでも物件の価値をAIによって瞬時に自動推定する技術が出てきています。その中でも、オフィスの価値を自動予測するサービスを展開するestieです。

3つ目の記事は技術的に興味がありますね。

優れた予測モデルが構築できれば、精度の高い予測の他に、物件の価値を左右するファクターの重要性も自動的に抽出することができます。

で結局どの要素が大事なの?

AIを使って、物件の価値を予測をすることができるか、試してみることにしたいと思います。もっと具体的には回帰を使って予測してみます。

使うのはアメリカが誇る頭脳を排出する都市、ボストンのデータなんですが、以下のような要素があります。

CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTRATIO B LSTAT MEDV

は、それぞれ、

1. CRIM:犯罪発生率
2. ZN:25,000兵法フィールド以上の住宅区画の割合
3. INDUS:非小売業の土地面積の割合(人口単位)
4. CHRS:チャールズ川沿いかどうか
5. NOX:窒素酸化物の濃度(pphm単位)
6. AGE:1940年よりも前に建てられた家屋の割合
7. DIS:ボストンの主な5つの雇用圏までの重み付きの距離
8. RAD:幹線道路へのアクセス指数
9. TAX:10,000ドル当たりの所得税率
10. PTRATIO:教師当たりの生徒数(人工単位)
11. B:1000(Bk−0.63)21000(Bk−0.63)2として計算、BkBkはアフリカ系アメリカ人居住者の割合(人口単位)
12. LSTAT:低所得者の割合
13. MDEV:住宅価格の中央値(単位1,000ドル)

となっています。

予測するときに、回帰器を用意するのですが、今回は線形回帰(linear), 線形回帰(ARD), ランダムフォレスト(RF), LightGBM(lgb), RBFカーネルを基底とするSVR(svr-rbf)を使ってみます。 

要素をすべてを使って予測すると…


画像1

と、かなり高い相関係数を示しています。特にlgbが高い精度ですね。

(エラーバーはピアソン相関係数の95%信頼区間を示しています)

それぞれの要素別に回帰器を適用すると、、特に

以下がNOX

画像2

以下がAGE

画像3

ということで、

5. NOX:窒素酸化物の濃度(pphm単位)
6. AGE:1940年よりも前に建てられた家屋の割合

について、相関係数がlgbにおいて、5では0.7近く、6では0.6程度出ていることがわかりました。これら2つが特に重要なファクターということなります。


後で都心情報も入手できればやってみます(データほしいです)


おわりに

実はアメリカ、すっごくやばいそうです。NYとかは、コロナで都心から本当に流出しているようです。日本も含めて興味深いデータが入手できれば、解析してみたいと思います。


最後に、参考にしたリンクを貼っておきます。


この記事が気に入ったらサポートをしてみませんか?