JupyterLabでCSVをガチャガチャする

最初にJupyterLabにログインし、新規ノートを作成します。

File→New→Notebook
つぎにKernelはPythonを選択します。
Untitled.pynb というようなファイルが作成されるのでわかりやすいように名前を変更します

続いてCSVを読み込むためにPandasモジュールをインポートします

import pandas as pd

上記のURLから港区、東京都、全国の人口推移を示すCSVファイルを取得し、作成したnoteファイルと同じ階層に設置します。
JupyterLabはドラッグアンドドロップにも対応しているので簡単です。

続いて次のコードを実行します。

population_data = pd.read_csv("jinkou_suii_2018.csv")
population_data

キャプチャ

特定の列のみ表示する

特定の列のみ表示する場合はloc,ilocをつかいます。

population_data.loc[:,['年[西暦]','東京都[人]']]

キャプチャ

population_data.iloc[:,2:5

キャプチャ

queryでの呼び出しも可能です。
が、列名に[]があるためか、うまく動かず。
エスケープの方法や、原因がわかる方いましたらご教示お願いします。
列名を 西暦 港区 東京都 全国に変更し再度読み込み

population_data = pd.read_csv("jinkou_suii_2018.csv")
population_data.query("西暦 >= '1980'")



キャプチャ


この記事が気に入ったらサポートをしてみませんか?