pandasメモ

棒グラフの描画

%matplotlib inline
df = pd.DataFrame({'lab':['A', 'B', 'C'], 'val':[10, 30, 20]})
df.plot.bar(x='lab', y='val', rot=0)

DataFrameとSeries

DataFrameは表(二次元)でSeriesはその列(一次元)に相当する

read_csv

csvファイルにヘッダーがない時は、

df= pd.read_csv('my.csv',header=None)

とするか、以下のようにヘッダーをリストとして与える

df= pd.read_csv('my.csv',names=['hoge','fuga'])

rank

列の各要素の順位を返す

複数条件での絞り込み

"and"ではなく"&"を使う。各条件に()をつける。

df = df[(df['A'] >= 20) & (df['B'] >= 30)]

df.query()を使う事もできる。変数名に@をつける事で、クエリ内に変数を用いることができる。

var = 'John'
df.query('A >= 20 & Name == @John')

Seriesを文字列として扱う

strアクセサを使う。


Series.str.METHOD_NAME()

とすることで、各要素ごとにメソッドが呼び出される。(strオブジェクトが持つほとんどのメソッドが呼び出し可能)

DataFrameの表示

JupyterNotebookでは、最後のセルで

df

とすることで、変数の表示ができるが、明示的に表示するならdisplayを使う。

display(df_a)
display(df_b)

とする。これであれば、一つのセルで複数のDataFrameを確認する事もできる

この記事が気に入ったらサポートをしてみませんか?