Python初心者 無料で学習を極める(6)
「機械学習のためのpython入門講座」SkillupAI様のday6目の講座から学んだことを記載していきます☆
本記事は、「あ!どんなふうにあれ使うっけ?」っと言うときに参考にしてもらえると嬉しいです。一通りpythonに慣れてきたら、実際のプログラムを載せるなどして皆さんと一緒にレベルアップができればと思います!
それでは6日目行ってみましょう!
day6:データの可視化 seaborn
Seabornの強み
高度なグラフ描写が可能で、機械学習ではカテゴリ毎に分布を比較することが頻繁にあります
Seabornを使う前の準備
「pip freeze」コマンドを用いて、自分の環境にseabornがインストールされているか、確認をしましょう。されている場合は、問題無し。していない場合は、「pip install seaborn」 でインストールを実施する
Seabornを使ってみよう
■棒グラフ(coutplot)
Matplotlibでも活用した棒グラフ。しかし、seabornの場合は、データ数を自動で数えて勝手に棒グラフ化ができてしまいます。
■棒グラフ(barplot() )
意味:カテゴリー毎に平均値を見たい
表現:各棒グラフに値のばらつき(標準偏差)を表現される
■ヒストグラム(distplot() )
意味:個数に合わせて、縦軸は割合(%表記)で見せたい
表現:ヒストグラム+ヒストグラムを滑らかにした曲線を重ねて見せる
■線形回帰プロット(regplot())
意味:散布図に線形回帰の直線を表したい
表現:データの傾向を反映した直線(線形回帰)を阿波s手表現
かつ 95%の信頼区間(直線の確信度)が自動で描画される
seaborn を複数描写
matplot のsubplotと同様に、複数のグラフを表現することを行いましょう
seaborn の強み(パート2)
ヒストグラムと散布図をそれぞれ一つずつ出力するのは大変。だから、ヒストグラムと散布図を行列表現し、プロットする方法がる
■散布図行列(pairplot())
全ての量的変数に対して、ヒストグラムと散布図を表示!データの分布・相関についての情報を一挙に得られる
■相関係数の可視化(heatmap())
相関係数の情報に色を付けて表現することが可能
■カテゴリー毎のデータ分布を表示(swarmplot())
day列に含まれるカテゴリー毎にtotal_bill列の分布を可視化
■カテゴリー毎にデータの分布を表示する(boxplot())
中央値と25%の信頼区間ごとの構成を表す
外れ値は、黒点で表示される
Seabornの各種プロット
こちらのサイトで色々なseabornのプロット例が記載されています。
プロットも本格的に出来るようになりましたね。
matplotよりもseabornの方が、簡単だ。笑。
今いち、matplotのメリットが見えなくなってきました。けど、matplotを理解した上で、seabornを活用すると学習力が上がった感。はありますね。
本日もお疲れ様でした!
過去の記事はこちら!ご参考に
よろしければサポート頂けると幸いです!子供へのパパ時間提供の御礼(お菓子)に活用させて頂きます☆