マガジンのカバー画像

Pandas

9
Python Pandasライブラリを使った実装をまとめています。
運営しているクリエイター

記事一覧

[Python] pandas groupbyを使って、日付毎に最も売れた商品を取得する

はじめにpandasで、groupbyを使用し、グループ内の最大値を持つ行を取得する実装について、まとめます。 使用するサンプルデータ売上一覧のサンプルデータを使用しました。 カラム構成は、下記です。 A列…date(日付) B列…id(商品ID) C列…category(商品カテゴリー) D列…name(商品名) E列…price(価格) F列…quantity(個数) なお、このデータは、下記のサイトを使用して作成しました。 使用するライブラリpand

[Python] pandas 上下の値を使って欠損値を埋める

はじめにCSVファイルを読み込んだ際、値が欠損している場合、上方向の値で埋める処理を、pandasで実現する方法について、まとめます。 イメージとしては、Excelの「フィル」機能を同じことを、pandasで対応するとなります。 下記のようなサンプルの場合、B2セルの日付を、B3セルからB7セルの間の空白に値を設定したいとします。 Excelで操作する場合、①対象セルを選択し、②「ホーム」タブから③「フィル」をクリックします。 ④メニューから、「下方向へのコピー」を選択

[Python] Googleスプレッドシートのデータを読み込み、pandasのDataFrame型として取り込む

はじめにPythonスクリプトにて、Googleスプレッドシートから読み込んだデータを、pandasのDataFrameに取り込む実装について、まとめます。 使用しているデータは、下記のサイトを使用してダミーデータを作成し、Googleスプレッドシートに展開しました。 動作環境windows11 Jupyter Notebook 6.4.5 Python 3.9.7 手順1.事前準備 事前準備として、Google Cloud Platformの設定と、使用するGo

[Python] pandas 1から始まる連番を設定した列を追加する

はじめにpandasのDataFrameで、「No」カラムを追加し、その列に、1からの連番を設定する実装についてご紹介します。 インデックスを使用する方法を考えましたが、下記の問題から断念しました。 pandas.DataFrame.reset_indexメソッドで、インデックスを振りなおしする場合、1から開始するオプションがない 連番を振る列に対し、カラム名を設定したい 使用するデータ下記サイトを使用してダミーデータ作成しました。 使用するライブラリpandas

[Python] pandas 条件抽出した行の特定の列に、一括で値を設定する

はじめにpandasのDataFrameで、条件抽出した行の特定の列に対して、一括で値を設定する実装についてご紹介します。 使用するライブラリpandas データ分析をサポートするライブラリです。 動作環境windows11 Jupyter Notebook 6.4.8 Python 3.8.12 実装処理は、Unitという列を追加し、Categoryの列に「果物」が設定されている場合、Unitの列に「個」を代入します。 はじめに、DataFrameにデータを設

[Python] pandas DataFrame データ抽出の方法

はじめにpandasで、データを抽出する方法として、下記の3つのパターンについて、実装を行います。 抽出条件を複数指定したい場合 抽出条件を含まない場合 抽出条件が1つの場合 例として、名簿の列に、住所情報(都道府県)がある場合、下記の条件でメンバーを抽出します。 首都圏に住むメンバーを抽出 首都圏以外に住むメンバーを抽出 特定の都道府県に住むメンバーを抽出 名簿のデータは、下記サイトを使用してダミーデータ作成しました。 使用するライブラリpandas デ

[Python]辞書型リストをpandasのDataFrameに変換する

はじめにPythonで、辞書型のリストをpandasのDataFrame型に変換する実装についてご紹介します。 使用するライブラリpandas データ分析、機械学習の実装で最も使用されるライブラリ。 動作環境・windows10 ・Jupyter Notebook 6.2.0 実装1. pandas.DataFrame()を使用する import pandas as pdvegtables1_1 = [{ 'name': 'バナナ', 'category':

[Python]pandas DataFrameの複数列の文字列を結合する2つの方法

はじめにPythonで、pandasのDataFrameの複数列の文字列を結合する方法を2つご紹介します。 使用するライブラリ pandas データ分析、機械学習の実装で最も使用されるライブラリ。 動作環境・windows10 ・Jupyter Notebook 6.2.0 実装1.複数列の文字列を結合する 使用するサンプルのDataFrameは下記です。 import pandas as pdaddress1 = [['神奈川県','横浜市鶴見区','鶴見中央'

[Python] pandas 特定の列に関数を適用する

はじめにpandasを使って、特定の列に関数を適用する実装を行います。 今回は、名簿(CSVファイル)の「名前(カタカナ)」の列に対して、ローマ字変換した列を新規に追加する、という処理を行います。 Pythonで、日本語からローマ字変換する実装については、下記でまとめています。 使用する名簿のデータは、「個人情報テストデータジェネレーター」を使用してダミーデータ作成しました。 使用するライブラリpandas データ分析、機械学習の実装で最も使用されるライブラリです。