見出し画像

Kaggleの不動産価格の予測に参加してみた

ChatGPTtoNoteableを用いて不動産価格を予測するコンペに参加してきました。

今回も全てChatGPTを用いてデータの可視化から関数の作成を行います。

変数を日本語と対応させる

まずはどんなデータがあるのかを英語と日本語で対応させます。
特に専門用語が混じると途端に難しくなるので、注意して読み込ませます。

  • Id: ID(識別子)

  • MSSubClass: MSサブクラス(建物クラス)

  • MSZoning: MSゾーニング(一般的なゾーニング分類)

  • LotFrontage: ロットフロンテージ(物件に接続された通りの直線フィート)

  • LotArea: ロットエリア(ロットサイズ(平方フィート))

  • Street: ストリート(道路アクセスの種類)

  • Alley: アリー(路地)

  • LotShape: ロットシェイプ(物件の形状)

  • LandContour: ランドコントゥア(物件の平坦性)

  • Utilities: ユーティリティ(利用可能なユーティリティの種類)

  • LotConfig: ロットコンフィグ(ロットの設定)

  • LandSlope: ランドスロープ(物件の傾斜)

  • Neighborhood: ネイバーフッド(アメス市内の物理的な場所)

  • Condition1: コンディション1(主要道路または鉄道への近さ)

  • Condition2: コンディション2(主要道路または鉄道への近さ(もし2つある場合))

  • BldgType: ビルタイプ(住宅のタイプ)

  • HouseStyle: ハウススタイル(住宅のスタイル)

  • OverallQual: オーバーオールクオリティ(材料と仕上げの全体的な品質)

  • OverallCond: オーバーオールコンディション(全体的な状態評価)

  • YearBuilt: 年ビルト(建設日)

  • YearRemodAdd: 年リモデルアド(改装日)

  • RoofStyle: ルーフスタイル(屋根のタイプ)

  • RoofMatl: ルーフマトル(屋根材)

  • Exterior1st: エクステリア1st(家の外装)

  • Exterior2nd: エクステリア2nd(家の外装(もし2つある場合))

  • MasVnrType: マスブニアタイプ(石積みのベニヤのタイプ)

  • MasVnrArea: マスブニアエリア(石積みのベニヤの面積(平方フィート))

  • ExterQual: エクスタークオリティ(外装材の品質- ExterCond: エクスターコンド(外装材の現状)

  • Foundation: ファウンデーション(基礎のタイプ)

  • BsmtQual: ベースメントクオリティ(地下室の高さ)

  • BsmtCond: ベースメントコンディション(地下室の一般的な状態)

  • BsmtExposure: ベースメントエクスポージャー(ウォークアウトまたはガーデンレベルの地下室の壁)

  • BsmtFinType1: ベースメントフィニッシュタイプ1(地下室の完成エリアの品質)

  • BsmtFinSF1: ベースメントフィニッシュSF1(タイプ1完成平方フィート)

  • BsmtFinType2: ベースメントフィニッシュタイプ2(地下室の完成エリアの品質(もし2つある場合))

  • BsmtFinSF2: ベースメントフィニッシュSF2(タイプ2完成平方フィート)

  • BsmtUnfSF: ベースメントアンフィニッシュSF(地下室エリアの未完成平方フィート)

  • TotalBsmtSF: トータルベースメントSF(地下室エリアの合計平方フィート)

  • Heating: ヒーティング(暖房のタイプ)

  • HeatingQC: ヒーティングQC(暖房の品質と状態)

  • CentralAir: セントラルエア(セントラルエアコン)

  • Electrical: エレクトリカル(電気システム)

  • 1stFlrSF: 1stフロアSF(1階の平方フィート)

  • 2ndFlrSF: 2ndフロアSF(2階の平方フィート)

  • LowQualFinSF: ロークオリティフィニッシュSF(低品質の完成平方フィート(全フロア))

  • GrLivArea: グレードリビングエリア(グレード以上(地上)のリビングエリアの平方フィート)

  • BsmtFullBath: ベースメントフルバス(地下室のフルバスルーム)

  • BsmtHalfBath: ベースメントハーフバス(地下室のハーフバスルーム)

基本的な統計情報を表示

まずはデータの大まかな情報を理解します。

nanが多いことからデータに欠損が多いことがわかります。

nanがあることより、データに欠損が生じている

ここから先は

4,117字 / 16画像

¥ 300

期間限定 PayPay支払いすると抽選でお得に!

この記事が気に入ったらサポートをしてみませんか?