Kaggleのチュートリアル第4版を書きました。pdf版9/20公開、紙版は9/22技術書典で頒布します

Kaggleのチュートリアル第4版書きました🎉🎉🎉

画像1

Kaggleを全くやったことがない人のための同人誌です。

メインコンテンツは、初心者向けのタイタニックコンペというコンペのデータの概要を理解して、LightGBMという強いアルゴリズムを使って予測してみるという内容の本。

版を重ねるに連れて付録の内容も増え、今回は付録に私の失敗談を追加し、124Pというページ数になりました。

最近のKaggleのサイトの更新にも対応しています。

pdf版はnoteで9/20公開予定(第3版のページに追加します)。紙版は9/22技術書典で販売します。私のサークルはく14Dという場所ですので、是非立ち読みにもきてくださいね。

以下ではもう少し詳しく説明します。

目次

第1部
-第1章 Kaggleについて
-第2章 コンペのページの翻訳など
-第3章 まずは、サブミットしてみる
第2部
-第4章 タイタニックデータの概要
-第5章 LightGBMでのタイタニック
付録
-A pandas-profilingでのEDA
-B LightGBMについての補足説明
-C Santander Value Prediction Challangeで金メダルを獲得しました
-D HomeCreditコンペ銀メダルを獲得するために行ったこと(寄稿)
-E PetfinderコンペValidationの失敗談
-F Kaggleの称号と用語集
-G データ分析の勉強方法
-H kaggleに9ヶ月取り組んで学んだこと

もっと詳細な目次は次の画像で。


画像2

画像3

第3版からの更新したこと

・Kaggleのサイトの変更 (KernelがNotebookに変更やUIの変更等) に対応
・第5章と付録Bを更新 (Light GBM Interfaceでの説明をメインにし、scikit-learnを介した使い方は付録B.4での説明に変更)
・付録EのPetFinderコンペでのValidationの失敗談を追加
・まえがき、あとがきを更新 など

技術書典

9/22は技術書典ですが、今回は初めての2フロアでの開催ということで、どのような状況になるのか。

これまでは自分も書いたい本を買いにも回っていたのですが、今回は諦めました。

多分ワンオペなので、ずっと自分のサークルにいたいと思います。

前回は15時に完売してしまったので、今回は多めに印刷したのですがどのようになるのか。


それではよろしくお願いします。


コメントお待ちしています。匿名の質問はマシュマロから→https://marshmallow-qa.com/currypurin