最近の記事

AI初心者がTitanic Challengeに挑戦 #05(一旦、終了)

さーて。 ■今回の手順、および結果: 1) 昨日書いた、「男性Pclass 1の重回帰分析をやってみる」」→ 良くもならず、悪くもならず 2) これも昨日書いた、乗船港は一つのパラメータにするのではなく、各々の港での乗船フラグを計3つ作る → 良くもならず、悪くもならず 3) いよいよKaggleで機械学習をトライ。ロジスティック回帰、ランダムフォレスト、LightBGMでやってみる。→悪化。それぞれいろいろ設定するパラメータがあるので、良くなる余地はあるのかもしれ

    • AI初心者がTitanic Challengeに挑戦 #04

      昨日はTitanicをさぼったわけではないが、noteに書く時間が無かった。 ※ちなみに今日はTitanicをさぼって、このnoteを書いているので、結局1日さぼっていることにはなる。 ■今回の手順: 昨日書いた、「41人中全員を死亡としている(実際には4割弱生存とみられる)女性Pclass 3 乗船港 S」が散々な結果だったが、データ不備があった点をやり直し。 具体的には1人当たりチケット価格を学習データとテストデータの両方を使って計算やり直し。結果は、、、 ■結果

      • AI初心者がTitanic Challengeに挑戦 #03

        今日はちょっと体調が悪くはかどらず。 ■今回の手順: 昨日書いた、「41人中全員を死亡としている(実際には4割弱生存とみられる)女性Pclass 3 乗船港 S」について学習データ88人分について重回帰分析を行い、これを元にテストデータに生死を付けてみる。相変わらずのエクセル作業。 1) Age(年齢)、SubSp(兄弟・配偶者人数)、Parch(親・子等)、1人当たりチケット価格 = Fare/[同じチケットナンバーの人数] とSurvived(生死)で重回帰分析。近似

        • AI初心者がTitanic Challengeに挑戦 #02

          昨日の反省を少しだけ活かして再チャレンジ。データを細かく見てみた。 ■今回の手順 1) データをSex(性別)、Pclass(船室クラス)で分類して生存率を見てみる。女性のPclass 1,2はほぼ生存、男性のPclass 2,3はほぼ死亡。(まさに映画タイタニックのローズ[ケイト]とジャック[レオ様]状態)男性のPclass 1も生存率は37%。これも映画で見た、ボートに女性を優先した情景。 2) 女性のPclass 3、男性のPclass 1の生死を分かつ要素が無い

        AI初心者がTitanic Challengeに挑戦 #05(一旦、終了)

          AI初心者がTitanic Challengeに挑戦 #01

          KaggleでTitanic Challengeに挑戦します。まだ、Pythonは使いこなせません。Excelで前処理したデータを重回帰分析してみました。 Titanic Challengeって何?って方は「Kaggle Titanic」でググってみてね。 ■ 今回の手順 1) CSVデータをザクっと見る: いろいろソート掛けて生存数/率を見てみる。Sex(性別)は影響の大きい因子っぽい、あとEmbarked(出発港)もかな。 2) 使うデータを決める:今回は、Nam

          AI初心者がTitanic Challengeに挑戦 #01