見出し画像

学習シリーズ第8弾!データ視覚化 (Matplotlib, Seaborn)

こんにちは!ChatGPTの原田です!学習シリーズ第8弾は「データ視覚化 (Matplotlib, Seaborn)」について学びます!では本文へどうぞ!!


1. 前回の答え

まずは前回の答えから!前回の記事はこちら!

1.1 Pandasによるデータ処理

DataFrameの作成:

import pandas as pd

# DataFrameの作成
df = pd.DataFrame({
    'Name': ['Alice', 'Bob', 'Carol'],
    'Age': [25, 30, 35],
    'Gender': ['F', 'M', 'F']
})

新しい行の追加:

# 新しい行を追加
df = df.append({'Name': 'Dave', 'Age': 40, 'Gender': 'M'}, ignore_index=True)

特定の条件に合致する行の抽出:

# 年齢が30以上の行を抽出
df_filtered = df[df['Age'] >= 30]

1.2 NumPyによるデータ処理

10x10の行列の作成とランダムな数値の割り当て:

import numpy as np

# 10x10の行列を作成
matrix = np.random.rand(10, 10)

各行と各列の合計:

# 各行の合計
row_sums = np.sum(matrix, axis=1)

# 各列の合計
column_sums = np.sum(matrix, axis=0)

最大値と最小値の探索:

# 最大値
max_value = np.max(matrix)

# 最小値
min_value = np.min(matrix)

解説:

  1. PandasのDataFrame:

    • `pd.DataFrame` を使用してDataFrameを作成し、辞書形式でデータを渡します。

    • `df.append` で新しい行を追加します。`ignore_index=True` は新しいインデックスを割り当てます。

    • 条件に基づく行の抽出はブールインデックスを使用して行います。

  2. NumPyの行列操作:

    • `np.random.rand` でランダムな数値を持つ行列を生成します。

    • `np.sum` で合計を計算し、`axis` パラメータで行方向か列方向を指定します。

    • `np.max` と `np.min` で行列内の最大値と最小値を見つけます。

これらのコードを実行することで、PandasとNumPyの基本的な使用方法を理解し、データの作成、操作、抽出の基本を学ぶことができます。

2. 学習スタート!

第8弾スタートです!

2.1 Matplotlib

import matplotlib.pyplot as plt

# データ準備
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]

# 折れ線グラフの作成
plt.plot(x, y)
plt.title("Line Graph Example")
plt.xlabel("X Axis")
plt.ylabel("Y Axis")
plt.show()

【実行結果】

2.2 Seaborn

import seaborn as sns
import matplotlib.pyplot as plt

# データセットの読み込み
tips = sns.load_dataset("tips")

# 箱ひげ図の作成
sns.boxplot(x="day", y="total_bill", data=tips)
plt.title("Box Plot of Total Bill by Day")
plt.show()

【実行結果】


MatplotlibとSeabornを組み合わせることで、柔軟性と美しさを兼ね備えた視覚化が可能になります。これらのライブラリを使いこなすことで、データの理解を深め、より有意義なインサイトを見つけ出すことができます!

3. 演習問題

3.1 Matplotlibを使ったデータ視覚化

Pandasで作成したデータフレームを用いて、いくつかの異なる種類のグラフ(例:折れ線グラフ、棒グラフ)を作成してみてください。

3.2 Seabornを使ったデータ視覚化

Seabornを使って、散布図や箱ひげ図などを作成してみてください。

これらのライブラリの基本的な使い方を学ぶことで、データの視覚化の技術を身につけることができます。

まとめ

第8弾のまとめです!

Matplotlib

  1. 概要: Pythonで最も一般的なデータ視覚化ライブラリ。多様なグラフとカスタマイズオプションを提供。

  2. 特徴:

    • 折れ線グラフ、棒グラフ、散布図、ヒストグラムなど多くのグラフタイプ。

    • グラフの細部(色、ラベル、線種、軸など)のカスタマイズが可能。

    • 対話型環境(Jupyterなど)との相性が良い。

  3. 使用法: データセットからグラフを作成し、視覚的にデータを分析・表現。

Seaborn

  1. 概要: Matplotlibに基づく高度な視覚化ライブラリ。統計的なデータ視覚化に特化。

  2. 特徴:

    • より洗練されたデフォルトのスタイル。

    • 箱ひげ図、バイオリンプロット、熱地図など統計グラフのサポート。

    • 複雑なデータセットの探索が容易。

  3. 使用法: 統計的なデータ解析を行い、洗練されたスタイルでグラフを表示。

これらのライブラリを学ぶことで、Pythonを使ったデータ視覚化の強力なスキルを習得できます! 今回は以上になります!


この記事が気に入ったらサポートをしてみませんか?