見出し画像

可視化

演習でグラフの描き方を教えたはずなのだが,ほとんどの学生がデータをきちんと可視化できない.可視化は,単にツールの使用法を学ぶだけではなく,データに応じて正しい可視化方法を選択するためのアートが必要になるからだ.

基本的な選択方法を決定木にしたものを見つけた.

データの種類(連続,カテゴリーなど)に応じて,適切な描画手段を示すものだが,決定木の葉にはたくさんの種類のグラフが並ぶ.ここから適切なものを選択するには,人間が判断できる描画要素の順(位置,方向,色調など)とセンスが必要になる.

これを習得するためには,多くの例題を「自分で」可視化してセンスを磨く必要があるが,このサイトではData Storyと称して例題を配布してくれている.

例題はR言語で書かれているので,演習でPython/Plotlyに直してもらうという追加課題を出すことにした.できない学生にあわせるとやる気のある学生が退屈するので,今年はこういった追加課題をたくさん準備しよう.

演習ではデータを読み込む必要がある.このサイトではgithub

https://github.com/holtzy/data_to_viz/tree/master/Example_dataset

にcsvファイルを置いているが,読む際にはファイルを選択して, "Raw" に変換してから読まないとpandasではエラーする.例としてこんな感じで読めばよい.

import pandas as pd
pd.read_csv("https://raw.githubusercontent.com/holtzy/data_to_viz/
master/Example_dataset/2_TwoNum.csv")



この記事が気に入ったらサポートをしてみませんか?