見出し画像

Pythonノック7本目

今日の気持ち

週末だ。今日は早めにPythonノックしてゆっくりしよう
毎日の精神安定剤になっている。

社内のエンジニアにどんどん難しくなりますよって助言を受け、ややビビっているが、積み上げていこう

7日目のログ

第1章「ノック7」

各種統計量を把握しよう

  • データ分析で着目するべき、重要な数字

    • 欠損している値の状況

    • 全体の数字感

  • どっちもわからん、どゆこと?

  • 欠損値があれば除去や保管をする必要があるとのこと

  • 欠損値が具体的にどういうものか、進めてみたらわかるかな

  • 数時感は全体の量の規模感って感じかこっちはわかる

join_data.isnull().sum()
  • 欠損値を確認

  • .isnull()関数で欠損値がtrue or falsで返ってくる

  • .sum()で集計できるっぽい

  • とりあえず集計しないとどんな感じか試してみる

  • なるほど全部調べて出してくれるんね

  • 欠陥値あるとtrueで返してくれるっぽい

    • 欠陥値とは

    • https://note.nkmk.me/python-pandas-nan-none-na/

    • 今は、数字じゃないデータやデータ無しという感じの認識でいいっぽい

  • 非数値の集計もしとく

  • おkぽい

  • 全体の数値感を確認してみよう

  • え?すごい、いきなり分析一覧出してくれるんだ

  • 便利

  • データの期間範囲を確認する

  • これはすっきりできた

  • ちょっと思ったけど

  • 関数が用意されているやつは一発なのに、期間範囲確認は.min()と.max()をわざわざ使って書いてる

  • 苦労して書いたけど実は関数があったみたいなこともありそう

  • 関数を調べる手段と癖を持っておけると良さそう

今日の学び

楽できるところは楽する癖を持とう

教典

この記事が気に入ったらサポートをしてみませんか?