見出し画像

データ視覚化の人類史-グラフの発明から時間と空間の可視化まで

データ視覚化の人類史 -グラフの発明から時間と空間の可視化まで(マイケル フレンドリー, ハワード ウェイナー 著)


概要

グラフやグラフィックは何の目的で作られたか。グラフはどのように進化し、無味乾燥な数字を見てすぐわかる図やグラフに変身させたか。そして、視覚的思考であるグラフがいかに社会を変えてきたかは歴史が物語る。

17世紀
・トレドとローマ間の経度距離を測定した最初の統計グラフ(ラングレン)

19世紀
・犯罪データを初めて統計地図に掲載(ゲリー)
・人工統計やコレラ感染を明瞭な図で表現(ファー&スノウ)
・棒グラフ、円グラフ、線グラフという形式を発明(プレイフェア)
・最も用途が広い散布図の発明(天文学者ハーシェル)

近代
・より動的にインタラクティブ、アニメーション化して直接操作へ発展

ビッグデータ時代において、世の中の膨大なデータをどのように有効活用し、データに踊らされないようにするリテラシーが必要。データ視覚化により作り手側と受け手側の双方向のコミュニケーションは人々の行動や考え方を変える力がある。

グラフは複雑な現象を理解したり、法則を発見したりする上で重要な役割を果たしてきた。

グラフの歴史

数字をグラフで表す方法はどのように出現したか?それはなぜか。

視覚的思考(ビジュアルシンキング)
ある課題と解決策は言葉や数値よりも視覚的に表示したほうが明確であったり伝達が可能であるという考え方

・人の元来のコミュニケーション:言葉、数字、図像
・紀元前3000年前メソポタミアで、粘土板の絵文字(絵による記録法)が発見されている
・初期の視覚化は世界の具体的かつ特定の何か(牛など)や地図など
・その後、抽象的で理論的な描写
・10世紀の天体描写(x、y座標で曲線で示されていたが、データに基づいていないため、スケッチに近いものだった)
・1360年代、二つの物理数量(時間、速度、距離など)の関係性を視覚化する最古の抽象グラフ。しかしこれもデータに基づいていない(オレーム)
・1644年、グラフの目的はよく知られた二つの地域間の経度距離の決定(ラングレン)

データの概念の誕生
数値的事実(調査し、比較し、計算できる)のような要素だけでなく、より大きな目的で主張したり反論したりするために整理された。

・1700年半ば、国策である人口増加により富を促進できるという見解のもと、人口分布の測定と分析の重要性が高まった

グラフの懸念
グラフは表よりも正確性に欠け、信頼できないという考え。一方で正確性は時によって不要であり目的とは無関係である主張。

棒グラフ、円グラフ、線グラフの発明

・19世紀、プレイフェアによる各種グラフの発明。タイトル、フレーム、ラベル、グリッド線などグラフの公式化(プレイフェア)
・プレイフェアは製図工の訓練を受け、見た目にも美しいデザインを見抜く観察眼があった
・1829年、犯罪と他の変数の関係性の統計地図の作成(ゲリー&バルビ)
→目で見て直接比較することができ、変化や相違が明白
・1836年、結婚・死亡などの報告義務が制定。怠ると罰金。これによりデータベースが作成された
・19世紀半ば、コレラの死亡率と気温や標高の関係グラフ(ファー)
・1854年、コレラの伝染、給水とのつながりの研究。地図に記載(スノウ)
・ナイチンゲールによるファーのグラフの修正

グラフィックスの黄金時代
1800年代の半ばに重要な社会問題(病気、犯罪など)に関する大量のデータがヨーロッパやアメリカで手に入るようになり統計理論が発展した。また印刷や複製技術の進歩もこれに貢献した。

・黄金時代のクライマックスは、1870年から1890年に10年ごとに行われた国勢調査(米国勢調査局)

散布図の誕生

プレイフェアのグラフや他のデータ表現は1つの変数以上ではあるが2次元には不十分だった。完全に2次元の散布図の発明は最も用途が広く有益だった

散布図の前提条件は座標系であること(ある変数をもうひとつの変数に対してプロットするという考え方)

プレイフェアは比較することを主な目的としていた経済データだったため線グラフが理想だった。散布図の発展には長い年月がかかった。

・天文学の分野で散布図が発展(ハーシェル)
・身体的特徴などの遺伝率の研究で使われた散布図(ゴルトン)
→その後、分散分析・重回帰分析へとつながっていった
・ゴルトンからピアソンの相関係数へと続く統計的手法

散布図ではクラスター、パターン、トレンドなど群・グループの関係性に利点があった。さらに視覚的注釈(囲む輪郭など)の追加でよりストーリーを語ることが可能となった

「ある図解の最大の価値は見えると思っていなかったものに気付かされるときである(テューキー)」

散布図のニーズは、科学者が2変量関係を考察する必要性によって生じた

近代

・20世紀前半はデータの暗黒時代。政府が支援する統計アルバムに関わるコストが負担となった。再び、数字と表に戻ることに。t検定や分散分析による有意性が重要なポイントに。
・1960年代、コンピュータが生成する統計グラフィックスの出現
・コンピュータやソフトウェアの発展により、動画で時系列変化を示したり、見るものが直接操作したりできるようになった。
・動的可視化(ダイナミックビジュアライゼーション)の次の進化はCGアニメーション。

詩としてのグラフ
感情の伝達、感情に訴えるグラフ。インパクトがありコンパクトでわかりやすいデザインのデータを組み合わせる必要がある。

「本を読む時に言葉を読んでいないのと同じように、人が読んでいるのは数字ではなくその意味である(ジェニーン)」

・アフリカ系アメリカ人の生活改善(デュボイス)と感情に訴える図解への変換(ミナール)。デュボイスのグラフィカルな物語はアフリカ系アメリカ人の現実がどのように始まり、どうなったかを示した。

グラフには魔力が宿る、曲線の形状は一瞬にして全体の状況を明らかにする。曲線は心を伝え、想像力を目覚めさせる。