見出し画像

Pythonノック4本目

今日の気持ち

今日は結構疲れたのでやめとこうとちょっと思ったけど、自然にやらないと気持ち悪くなってる。習慣としてはいい

記事公開まで一日20分程度のルーティンを作れたので気軽にできる

何だか楽しくなってきた

教典

今日もこの本を進める、100本ノックだ

4日目のログ

第1章「ノック4」

マスタデータを結合(ジョイン)してみよう

-
  • 今日もジョインだ、繰り返し学習たすかる

  • 足りない(付加したい)データ列は何か?共通するデータ列は何か?を考える、考えるぞ

  • customer_masterとitem_masterをジョイン

  • の前に、ずっと気になっていたんだけど、コードブロックを上から順番に全部実行することできないのかな、毎回上から一個づつ実行するのたるい

  • https://www.kikagaku.co.jp/kikagaku-blog/google-colaboratory-shortcut/#i-0

    • 全セルの実行はCtrl/cmd + F9

    • または、メニューの「ランタイム」から「すべてのセルを実行」

  • とりあえずデータの内容をみてみる

  • customer_master.head()で初めの5行を表示、これは覚えた

customer_master
item_master
  • 聖天のサンプルコード

join_data = pd.merge(join_data, customer_master, on=“customer_id”, how=“left”)
join_data = pd.merge(join_data, item_master, on=“item_id, how=“left”)
  • あれ、わからなくなってきた

  • costomer_masterとitem_masterをジョインするんだよね

  • コードを読んでも対応関係がわからんくなった

  • 今私は何のファイルをいじっているのだ?

  • ドライブを確認してもわからない

  • ファイルを結合した結果のファイルは何処?

  • これはもしかして二つのファイルを結合した結果を、join_dataという変数に収納してる?

  • どうやらそうっぽい

  • データ=ファイルという認識が誤っているっぽい

  • そういえばここまでも、csvファイルを変数に収納してから処理してるわ

  • ファイルの中身はいじってないのかーうわーそうかー

  • DBに収めたりするのはこれから先なのかな、なんかプログラム上だけで処理し続けるのが謎に不安、よるべない

  • でもこれでわかった。join_dataを確認すればいい

join_data
  • ノック3でジョインしたやつが出てきた

  • そうだよそうだよ

  • ここにcustomer_masterとitem_masterをジョインするんだな

  • わかってきたぞ

  • 改めてノック3も見直したらコードの構造がわかってきた

  • ジョイン先データ = pd.merge(ジョインデータ1, ジョインデータ2, on=“キー列”, how=“left”)

  • ジョイン成功〜!

  • 躓いたけどちゃんと振り返って構造理解したからよかった

  • 確認するとデータを重複して書き込んでる

  • 何回か無駄に実行したからだと思われる

  • ノック2と3のログnoteを読み返すと結合するデータの関係性の理解が間違ってる

  • join_dataという変数の存在を無視して理解してた。じっくり理解して良かった

  • 変数というものの理解が進んだ

  • ノック2で出てきてた「データフレーム型の変数」にデータを読み込んで処理してたのかオレは

  • 週末に一からやり直して復習してみよう

今日の学び

UIに慣れきったファイル編集のメンタルモデルに囚われてはいけない、私は情報を処理している

この記事が気に入ったらサポートをしてみませんか?