見出し画像

ゼロから始めるデータサイエンス入門:5日目

5日目はデータフレームの話から。

データフレームで使う、行(row)と列(column)は日常会話より狭い意味で使うそうだ。(日常会話で行と列って使うんだろうか…)

import pandas as pd
これはPython1年生でもよくみたやつ。これがデータフレームを使うための準備。(そういえばそうだった)

データを列ごとに記述する方法とデータを見た目の通りに記述する方法は覚えてたので、割愛(一応やったけど)

データフレームのサイズと組み合わせはわからない。

こういう話らしい。

from itertools import product
my_df2=pd.DataFrame(
    product([1,2,3],[10,100]),
    columns=['X','Y']
my_df2

なにをしてるかというと、Xが1,2,3のいずれか、Yが10、100のいずれかとしたときのXとYのすべての組みあわせをデータフレームにしている。(んだそうな。自力でやったら死んでしまいそう。この手の問題めっちゃ苦手だった)

列と行の名前を取り出したり変更したり、設定したり…。

複数列の取り出しとかいろいろ…。

するするっと進んでもなんとかなってるけど、これたぶんPython1年生と2年生をちゃんとまじめにやったからだろうなぁ…

けっこういろんなところに「割愛」って書いてあって、この本が最初の本だったら「え、なんでそうなるの?わかんない」ってなってた可能性がものすごおおおくある。

機械学習のアルゴリズムでは行列(数を長方形に並べたもの)をよく使います。

ゼロからはじめるデータサイエンス入門

そして、この一文で固まる私。苦手だったんだよねぇ…行列。
数学は好きだけど、方程式とか数学的帰納法の証明問題とか、図形が好きなのよ…。行列はどうも苦手でなぁ…。ぐぬぬ…。

と言っていたら次のページからがっつり行列だった。
ゔーん。これは該当箇所の勉強をしなきゃいけないやつかしら。見るだけでもいやってわけじゃないし、今のところわかる気がするから行き詰ったらかんがえよう。

ところで…noteで行列を書く時ってどうしたらいいんだろうな…

いい時間になったので、今日はここまで。
明日は行列から。

この記事が気に入ったらサポートをしてみませんか?