記事一覧
データフレームに任意の列を追加したい
自分のデータに任意の列を追加したい時がある。
今回は、任意の列を足す練習。
デモデータpandasを使って表を作成する
import pandas as pddf = pd.DataFrame({'A': ['100', '100', '90', '80'], 'B': ['53', '48', '46', '49'], '
def を使いこなす② 関数の呼び出し方
関数の呼び出し方について説明します。関数の定義の仕方と呼び出し方、関数における引数や戻り値はどれも関数の基本なので、必ず理解しておきましょう。
defを使いこなす①return(戻り値)の記事にて、関数の設定の仕方を学習しました。
では、作った関数はどのようにして呼び出すのでしょうか。いくつかの例題で考えてみましょう。
returnを省略した関数def add(a, b): print
画像を読み込み、可視化する方法
Pythonでは画像処理も簡単にできます。
OpenCVというモジュールをインポートすると、画像処理が可能に。
変数の中に画像を格納することや、画像を簡単に二次元のnumpyアレイにしてくれ、非常に扱いやすくなります。
本日は、その基礎の基礎。
画像を読み込み、可視化しましょう。
目的の画像イラスト屋の画像を使わせてもらっています。この画像で、柄を二値化したいとします。
かわいいですね
numpyのarrayの抽出②
numpy の2次元arrayの抽出をいろいろ試してみましょう。
まずは、1から始まり100までのデータを10×10に整形します。
ary1 = np.arange(1,101).reshape(10,10)print(ary1)
実行結果:
[[ 1 2 3 4 5 6 7 8 9 10][ 11 12 13 14 15 16 17 18
defを使いこなす①return(戻り値)
pythonのコードが少しかけてくると、defを使って書いている人をよくみかけて、羨ましくなる。defの基礎を学びたい!
def(関数)とは何だ?そもそも関数とは何だ?というお話。
中学の頃関数を習いましたが、その考えそのものです。
例えば、
y=3x
という式があった場合、yの値はxの値によって変化します。この関係を『yはxの関数である』といいます。
で、高校になると数学は単純にyが
matplotlib csvデータ(irisデータ)で箱ひげ図やヒストグラムを描いてみよう
グラフを描く時は、自分のExcelやcsvで描く場合が多いと思います。
そして、個人的には1回しか作成しない図は、Excelで済ます方が早い気がします。何度も描く図であったり、大量のcsvがある場合は、pythonがよろしいかと。
コードでヒストグラム便利なseabeanなどもありますが、とにかくmatplotlibで描いてみましょう。.hist()で描けます。
import numpy a
matplotlib 箱ひげ図
箱ひげ図を描きます。
分かっている前提でのコードなので、箱ひげ図ときいて、ハテナの人はググってもらえますと助かります(ごめんなさいね)。
箱ひげ図を1つ描くax.boxplot()を使った基本的な方法です。
test = [100, 82, 65, 50, 63, 88, 98, 35, 78, 69]
としたうえで、テストの成績を描いてみましょう。
%matplotlib inline
Matplotlibでグラフ(散布図、検量線まで引いてみる)
ここでは散布図を描いてみます。
散布図の基礎散布図は以下の描き方があります。
・pltを使う(%matplotlib inline) 場合: plt.scatter()
・オブジェクト指向(コードで解決する)場合 : ax.scatter()
2種類で描くことができます。
筆者は前者で進めますが、念のため後者も記述します。
散布図を作成散布図を作成するには、
plt.scatter(
matplotlib 図を描く(% matplotlib inlineと、fig = plt.figure())
pythonでグラフを描きたい時、Googleで『基礎』を知りたくて検索しても、まず『図の配置の仕方』から始まって、肝心のグラフの説明は後回しで、心が折れそうになります。
確かに基礎は基礎ですが、とにかく意中のグラフを描きたいのが初心者のホントのトコロ。
最低限のお作法を踏んだ上で、すぐにグラフにとりかかりませよう。
嫌になる前に、とにかくまず描いてしまいましょう。
matplotlibを
Pandas groupby で任意のデータだけを区分けする
Excelやcsvのデータ処理をすると、『この条件で図を描きたい』と思う時があります。例えば、irisデータだと品目を区分けしてグラフを描く。みたいな。
それには、groupby()という関数が便利です。
ということで、さっそくirisデータの品目を区分けしてみましょう。
irisデータの取得はこちらの過去記事で。
groupbyを使ってみよう図を描くために必要なライブラリーをインポートし
Pandas データのマージ
マージ (merge)とは、何かと何かをくっつける、統合するという意味です。単純にデータの統合というよりも、IDなどで紐づけられているデータがあった場合に便利な関数です。例えば、先に身長データが合った際、IDに紐づけることで体重データを足したり、1年後の体重の推移を足すことも可能。まぁ、やってみましょう。
基礎のマージ2つのdataframe、df1とdf2を作ります。
import pand
Pandas 行列ごとの処理 for
PythonでPandasを使う人の多くは、自分のExcelやcsvデータに対し、何等かの処理をしたい場合が多い。
単発の処理だとExcel内でやってしまえばよいので、Pythonで仕立てるメリットは少ない。やはり、繰り返しができるからこそPythonでする意味、メリットが大きくなる。
ということで、今回はfor を使って、とにかく1回の処理ではなく、繰り返してみることにしましょう。
iri
Python リスト とは
リストとは、データ型の一つ。
代表的なデータ型は、リスト・タプル・辞書・集合の4つ。特に覚えなくて良いが、リストはよく使うので動かして覚えると良いと思います。
リストの作り方角かっこ[ ]で囲み整数、浮動小数点数、文字列などのデータを格納できます。リストには好きな種類のデータを好きなだけ格納できます。リストに格納できる個々のデータは『要素』といいます。
data = ['book','tex
Pandas Seriesを極める
numpy に勤しみましたが、今度はPandasに挑戦しましょう。
PandasとはPythonのライブラリーの1つ。んん?と思った方、分かり易く説明しましょう。Pythonだけだと何も入れていないスマホのイメージです。そこにアプリを入れることで、LINEができたり、ゲームができたり、インスタなども可能になります。ライブラリーはそんな『アプリ』のようなイメージだと分かり易いと思います。
Pan
Pandas csvデータ出入力とアクセス
pythonを使っていると、任意のarrayを打ち込むよりも、持っているデータを解析したい場合が多々あると思います。
特に、csvデータの入出力はよくすると思います。
おなじみ、irisデータをPandasで読み込み、データにアクセスしましょう。
irisをPandasで抽出入力は、pd.read_csv()で簡単にできます。
()の中に、csvが置いてある住所とcsvの名前をかけばOK。