見出し画像

Pythonコーディング(pandas編)

こんばんは、Hiroyaです。
いつも記事を読んでいただきありがとうございます。

本日はPythonで今作成しているプログラムの一部を紹介します。

今回使っていくライブラリは、「pandas」です。
機械学習やデータ分析をされる方には必須のライブラリになると思います。

今回はExcelの読み込みのみの説明をしていきます。

インストール

まずは、コマンドプロンプトにて「pandas」のインストールコマンドを実行してください。
前提として、python3、pipのインストールをしておいてください。

pip install pandas

インストールがされました。
pipの新しいバージョンあるよ、というメッセージはいったんスルーで。

次に「openpyxl」のインストールを行ってください。
Excelファイルの読み込みに必要となります。

pip install openpyxl

インストールがされました。

Excelファイルとプログラム

次にExcelファイルに任意の文字列を記載していきます。
私は、「job_data.xlsx」というファイルに仕事内容を記載しました。

Excelから読み込みを行い、表示するプログラムを書きました。

import pandas as pd

# Excelファイルからデータを読み込む
excel_data = pd.read_excel('job_data.xlsx')

# 各行の情報を取得して表示
for index, row in excel_data.iterrows():
    job_category = row['JobCategory']
    occupation = row['Occupation']
    display_occupation = row['DisplayOccupation']
    job_description = row['JobDescription']

    print(f'Job Category: {job_category}')
    print(f'Occupation: {occupation}')
    print(f'Display Occupation: {display_occupation}')
    print(f'Job Description: {job_description}')
    print('\n')

実行後は下記の表示がされました。

各行のデータは row に格納されます。

row['JobCategory'] でExcelのA列の 'JobCategory' の値が取得され、変数 job_category に代入されます。

本日は、「pandas」を使った読み込みだけですが他にもデータ処理に使われる機会が多いです。
ここまで読んでいただき、ありがとうございました。

この記事が気に入ったらサポートをしてみませんか?