見出し画像

初心者からKaggle銀メダルへの道 vol.2

皆さんこんにちは!
このnoteでは完全な初心者からkaggleで銀メダルをとるという目標に向かってどのように勉強していくかという内容の記事を投稿しています。

これはあくまで私の体験談が皆さんのお役に立てればと思っているものなので、技術的な質問や、個人的なコーチングをご希望の方は以下のオンラインサロンものぞいてみてください。

今回は以下の2点をお話しできればと思います!

・PyQについて
・タイタニックに触れてみて思ったこと

以上の2点になります。

【PyQについて】

Pythonを学ぶにあたって、PyQというサービスがあります。

データ分析だけでなく、アプリ開発などでも用いられているPythonを自分でコードを打ちながら覚えるというコンテンツになっています。このPyQについて以下の2点の内容をお話しします。

PyQのすごいところ

PyQのすごいところはとにかくコンテンツの多さです。Pythonの1から10までを学ぶことができます。PyQを全部クリアするには200時間かかるとのことです笑。
実際にはわからない部分を調べたり、模範解答ではないけど、自分が表現したいコードを実現するためにあの手この手を試してみたりと、もっと時間がかかるかもしれません。言ってしまえば修行です笑。
大量の内容を自分の手を動かしながら学べるという点で、体にしみこむコンテンツになっている点が、PyQのすごいところです。

PyQ の弱点の補い方

デメリットを上げるとすれば、①少し説明が雑である、②どのコードが重要な部分で、どのようなときに使うものなのかが少し見にくい。この二点だと思いました。

どちらに関しても共通して言える解決法が2つあると感じました。
1つ目がUdemyの講座を併用していくこと、2つ目が誰か相談できる人間を持つということです。

私の場合は先にUdemyの講座を受講していたため、少し雑でも「あー!あれね!」となりました。また、周りで相談できる人間もいなかったので、先に書いたオンラインサロンでコーチングを受ける形をとりました。

余談ですが、Udemyを受けると、pandasは少しわかるけでそもそもその前提となっているPythonがわからないという状態になりました。それを逆にPyQで補ったという面もあります


タイタニックに触れてみて思ったこと

kaggleにはいくつものコンペティションがありますが、ほとんどの初心者が最初にやるコンペ練習用のコンペとして、「タイタニック」というコンペがあります。かの有名なタイタニックの乗客のデータを用いて生存する人間を予測するという内容になっています。


今回はこのタイタニックの具体的な内容ではなく、こういうスキルが必要だよねということをお話しします。

何をどうしたらいいのかわからない

初めてデータを目の前にするとやはり何をどうしたらいいのかわからなくなります。そこで本を読んで調べてみたり、いろいろなブログを漁りながら写経をしていくことになります。

と、ここで!写経に関して私がやらかしたことがあります。それはどんな処理をしているかなぞだけどとりあえず写経しとけ!です。これから未知のデータに出会ったときに、私自身の力で切り開いていくための練習なのに、それをやっちゃダメです。というのもわたしはまんまとこれをやって、コーチングしていただいている方は「あー、それは完全にあかんやつだねえ」って感じでした。わからない処理が出てきたら、一行一行分解して、確実に理解してから進むと心に誓います!

コードが書けない

何をするのか理解した後に関しても自分の表現したいことを実現するためのコードが書けないです。とにかくたくさんのエラーが出ました。

画像1

やはりいちいちエラーでつっかかっていると、自分が本当にやりたい可視化や特徴量エンジニアリングができなくなってしまいます。そのため、前述のPyQでコード自体を学びながらコンペにも参加していくという流れになっています。

あと、可視化で有名なライブラリとして、matplotlibとseabornがあります。私はまだまだ慣れないのでseabornで描いています。matplotlibのほうができることは多いようなのですが、複雑でわかりにくいものとなります。最初のうちは、seabornがおすすめです!

今回は以上になります!お読みいただきありがとうございました!


この記事が気に入ったらサポートをしてみませんか?