見出し画像

けんちゃんのAI Quest攻略日記#12「Pythonデータ分析入門コース修了!」

こんにちは!「デジテック for YAMAGUCHI」運営事務局のケンタです。
本日はQuest開始から182日目です。攻略日記も12回目を迎えることができました。このところハンズオン講座に係りっきりでしたので久しぶりの攻略日記となります。前回の投稿からなかなか攻略が進んでいなかったのですが、これから攻略のペースをアップしていきたいと思っています。
皆さん優しく見守ってください。
ぜひ最後まで読んでもらえると嬉しいです。

「燃費予測モデルの予測精度改善」

02  自動車環境性能の改善

前回から引き続き「自動車環境性能の改善」に挑戦です。
今回は、作成したモデルの予測精度の改善方策について学びます。
1.特徴量を作成 
予測に役立ちそうな情報をデータ加工して新しく特徴量を作成します。
質的データを数値データに変換するダミー変数化(pd.get_dummies関数)や線形回帰分布へ変換する対数化(log関数)の手法を学習。
2.特徴量を選択 
関連性の高い特徴量だけを選択して予測精度を向上させます。
フィルタ法、ラッパー法、組み込み法の手法を学習。
3.予測精度を検証
新しく作成した特徴量を用いたモデルを作成して予測精度を検証。

「Conclusion」

続いて、本講座のまとめとしてモデリングのおさらいです。
1. 目的変数・説明変数(ダミー変数化)の作成
2. 学習データと評価データに分割
3. モデル変数を作成して目的変数・説明変数を用いてモデルを学習
4. 学習済みモデルと説明変数を用いてデータに対する予測値を算出
5. 予測値と評価関数を用いてモデルの予測精度を評価

データ分析の基本的な手順、モデルの作成方法、モデルの予測精度の向上のために重要な特徴量の加工手法について確認したところで講座修了です!!

「自動車環境性能の改善クリア!」

03  自動車環境性能の改善クリア

という訳で、ようやく「自動車環境性能の改善」講座クリアです。
難易度は「★☆☆☆☆(星1つ)」ですが、初めての「Quest」攻略です。
前回75%まで進めていたので1時間程度の学習時間ですが、攻略までは非常に長い道程でした。本講座に取り組み始めたのは夏の終わり頃、9月末ですから、3か月近く1つの講座に取り組んで来ました。長かったですが、今は達成感と充実感に満たされています!
以前も言いましたが「pandas入門道場」のおさらいといった感じで1つ1つのタスクも簡潔で初心者でも受講しやすい講座でした。

「Python環境設定クリア!」

04  環境設定

05  環境設定クリア

続いて「Python環境設定」も修了!ビデオ視聴のみであっという間に修了ですが、講座以外でPythonを動かしたいので設定まで行います。かなり時間は掛かりましたがなんとか設定完了。これで次のハンズオン講座に参加できるようになりました。

「Pythonデータ分析入門コース修了!!」

06  Pythonデータ分析入門コース修了

という訳で、ようやくですが「Pythonデータ分析入門コース」の修了です。クラウンマークの修了証明書も頂きました。
Python入門(難易度:★☆☆☆☆)
pandas入門道場(難易度:★☆☆☆☆)
自動車環境性能の改善(難易度:★☆☆☆☆)
Python環境設定(難易度:★☆☆☆☆)

やまぐちAI Quest進捗情報

07_1  進捗ランキング001

07_2  進捗ランキング002

07_3  進捗ランキング003

皆さんの進捗状況です。(12月27日18時時点)
「AIリテラシーコース」修了者72人(前回64人)
「ノーコードデータ分析コース修了者37人(前回34人)
「レベル30以上」の方62人(前回57人)
「獲得Exp50以上」の方216人(前回197人)

もう一つ、ハンズオンのための推奨講座の進捗状況もお伝えします。
「AI入門」修了者140人(前回125人)
「Python入門」修了者59人(前回49人)
「Python環境設定」修了者47人(前回41人)
「自動車環境性能の改善」修了者40人(前回36人)
少しずつですがまだまだ受講者も増加中です。担当として嬉しく思う一方、折角なので、受講者の方全員がデータ分析の初学者であるレベル30までは受講を進めて欲しいな~とも願ってもいます。

あとがき・次回予告

講座の開始から3カ月程掛かりましたが、何とか「自動車環境性能の改善」講座を修了できました!ようやくベホイミの呪文も覚えることが出来た気がします。データサイエンティストへの道筋が少しだけ見えて来たのかな~という感じです。ぼんやりとですが。

また、最近気づいたのですが、新しいGym講座が追加されています。
「モバイル空間統計®」
モバイル空間統計を通じて人口データの取り扱いを学び、COVID-19下における人の滞在について分析・考察まで行う講座です。
「優良顧客の特定」
ID‐POSデータによるRFM分析手法を用いた顧客傾向の確認方法や優良顧客の特定方法を学びます。

またまたデータサイエンティストへの道程が険しく感じられたところです。
e-Learning講座を学習できるのも来年3月末までの残り3カ月です。全ての講座の修了を目指して頑張ります!という意気込みをお伝えしたところで、今回はこのあたりで終わりとさせていただきます。
最後までお読みいただきありがとうございました。
皆さまが楽しく学習を進められますように。

次回は「Pythonモデリング入門コース突入!」をお伝えする予定です。
ご期待ください。