使えそう2
pe["nationality"].unique()
pe["nationality"].unique().tolist()
df = pd.read_csv('train.csv', nrows=500)
df['C2'].fillna(df['C2'].mean())
data.sort_values("年収").head()
df.astype("str").describe() (オブジェクトの場合)
pandas.[DataFrame or Series].where(cond,other=nan,inplace=False,axis=None,level=None,errors=’raise’,try_cast=False,raise_on_error=None)
割合を計算する
round(df['C1'].value_counts() / len(df), 2)
被りを消す 指定
pe.drop_duplicates(subset="nationality")
df =df.rename(columns={"平均気温":"平均"})
df.sort_values("最高気温(℃)")
pd.get_dummies(pe["nationality"])
pd.get_dummies(pe,columns=["nationality"])
df.dropna(axis=1).head() 欠損列方向
df.groupby("Class").mean()
df[:50].plot(x="年月日",y=["平均気温(℃)","最低気温(℃)"])
軸の幅を指定
plt.xlim,(0,40)
plt.ylim(0,120)
メモリの幅を指定
plt.xticks(np.range(0,10)
plt.yticks(np.arange(0,10,2)
1✖️3のグラフ
plt.figure(figsize=(9,0))
plt.subplot(131)
plt.bar(a,v)
plt.subplot(132)
plt.scatter(a,v)
plt.subplot(133)
plt.plot(a,v)
3Dgurafu
from mpl_toolkits.mplot3d import Axes3D
ある条件を満たす要素を置き換えるときは、whereメソッドを使うと便利です。引数の内容は( 条件、 置き換える値、 条件を満たさない要素の値 )です。
X = np.arange(20).reshape(-1, 1)
y = np.random.rand(20)
y = np.where(y < 0.5, 0, 1).reshape(-1, 1)
pd.set_option(‘display.max_rows’, 10)
isinメソッドを使って都道府県で沖縄県と北海道のデータを抽出してください
df[df[‘都道府県名’].isin([‘沖縄県’,’北海道’])]
6 containsメソッドを使って「川」を含む都道府県を抽出してください。
df[df[‘都道府県名’].str.contains(‘川’)]
7 startswithメソッドを使って「北」から始まる都道府県を抽出して下さい。
df[df[‘都道府県名’].str.startswith(‘東’)]
8 endswithメソッドを使って「府」でおわる都道府県を算出してください。
df[df[‘都道府県名’].str.endswith(‘府’)]
この記事が気に入ったらサポートをしてみませんか?