pandasメモ
棒グラフの描画
%matplotlib inline
df = pd.DataFrame({'lab':['A', 'B', 'C'], 'val':[10, 30, 20]})
df.plot.bar(x='lab', y='val', rot=0)
DataFrameとSeries
DataFrameは表(二次元)でSeriesはその列(一次元)に相当する
read_csv
csvファイルにヘッダーがない時は、
df= pd.read_csv('my.csv',header=None)
とするか、以下のようにヘッダーをリストとして与える
df= pd.read_csv('my.csv',names=['hoge','fuga'])
rank
列の各要素の順位を返す
複数条件での絞り込み
"and"ではなく"&"を使う。各条件に()をつける。
df = df[(df['A'] >= 20) & (df['B'] >= 30)]
df.query()を使う事もできる。変数名に@をつける事で、クエリ内に変数を用いることができる。
var = 'John'
df.query('A >= 20 & Name == @John')
Seriesを文字列として扱う
strアクセサを使う。
Series.str.METHOD_NAME()
とすることで、各要素ごとにメソッドが呼び出される。(strオブジェクトが持つほとんどのメソッドが呼び出し可能)
DataFrameの表示
JupyterNotebookでは、最後のセルで
df
とすることで、変数の表示ができるが、明示的に表示するならdisplayを使う。
display(df_a)
display(df_b)
とする。これであれば、一つのセルで複数のDataFrameを確認する事もできる
この記事が気に入ったらサポートをしてみませんか?