ゼロから始めるデータサイエンス入門:5日目
5日目はデータフレームの話から。
データフレームで使う、行(row)と列(column)は日常会話より狭い意味で使うそうだ。(日常会話で行と列って使うんだろうか…)
import pandas as pd
これはPython1年生でもよくみたやつ。これがデータフレームを使うための準備。(そういえばそうだった)
データを列ごとに記述する方法とデータを見た目の通りに記述する方法は覚えてたので、割愛(一応やったけど)
データフレームのサイズと組み合わせはわからない。
こういう話らしい。
from itertools import product
my_df2=pd.DataFrame(
product([1,2,3],[10,100]),
columns=['X','Y']
my_df2
なにをしてるかというと、Xが1,2,3のいずれか、Yが10、100のいずれかとしたときのXとYのすべての組みあわせをデータフレームにしている。(んだそうな。自力でやったら死んでしまいそう。この手の問題めっちゃ苦手だった)
列と行の名前を取り出したり変更したり、設定したり…。
複数列の取り出しとかいろいろ…。
するするっと進んでもなんとかなってるけど、これたぶんPython1年生と2年生をちゃんとまじめにやったからだろうなぁ…
けっこういろんなところに「割愛」って書いてあって、この本が最初の本だったら「え、なんでそうなるの?わかんない」ってなってた可能性がものすごおおおくある。
そして、この一文で固まる私。苦手だったんだよねぇ…行列。
数学は好きだけど、方程式とか数学的帰納法の証明問題とか、図形が好きなのよ…。行列はどうも苦手でなぁ…。ぐぬぬ…。
と言っていたら次のページからがっつり行列だった。
ゔーん。これは該当箇所の勉強をしなきゃいけないやつかしら。見るだけでもいやってわけじゃないし、今のところわかる気がするから行き詰ったらかんがえよう。
ところで…noteで行列を書く時ってどうしたらいいんだろうな…
いい時間になったので、今日はここまで。
明日は行列から。
この記事が気に入ったらサポートをしてみませんか?