Regonn&Curry.fm Episode 119収録後記 分析コンペ勉強会で発表しました


このnoteは、Regonn&Curry.fm というポッドキャストの第119回の収録後記です。

話したことはこちらのscrapboxから。

第119回では、PtitPrinceのチュートリアルやりました、pytoch1.8リリース、J-Quants ファンダメンタルズ分析チャレンジ! 〜モデルの投稿方法特集〜、CF + Fin ML勉強会、Tellus User Group もくもく会#1、今週のKaggleについて話しています。

その中で、PtitPrinceのことを書きたいと思います。

PtitPrinceとは

PtitPrinceは、次のような可視化を簡単にしてくれるライブラリです。

画像1

左から、バイオリンプロット、箱ひげ図、ドットプロットとなっています。

これはタイタニックコンペのデータですが、Pclassが1、2、3毎に、Fareについて、3つの可視化をしたものです。
これは、PtitPrinceを使うと次のようなコードで実現することができます。

from ptitprince import PtitPrince as pt

f, ax = plt.subplots(figsize=(7, 5))
pal = sns.color_palette(n_colors=1)

pt.RainCloud(x="Pclass", y="Fare", data=train, palette=pal, bw=0.2,
            width_viol=.6, ax=ax, orient="v", move=.2)

簡単ですね。その他チュートリアルを、タイタニックのデータで動かしたものをKaggleのnotebookでやりました。


これは#10 [初心者歓迎!] atmaCupというデータ分析のコンペで、主催のnyk510さんが、これを使った説明をされており、便利だなと思い使ってみたものです。
nyk510さんのコードと可視化結果はこちらで公開されています。


コメントお待ちしています。匿名の質問はマシュマロから→https://marshmallow-qa.com/currypurin