「グラフをつくる前に読む本」を読む前に聞く話~伝わるグラフはこんな風に~
本noteは、2018年6月7日、総務省統計局の現状分析研究会講演会で話した内容をまとめたものです。
自己紹介(怪しい者では無い)
はじめまして、松本健太郎(@matsuken0716)です。株式会社デコムでR&D部門を率いています。決して怪しい者ではございません。
一応、こんな感じでビジネス書を刊行しております。人工知能が多いですね。
株式会社デコムはマーケティングリサーチ業界に属しますが、得意としているのは「インサイト」です。インサイト…あまり聞き馴染みが無い言葉だと思うので、少しだけ補足します。
以下は、全米における1人あたりの飲用牛乳消費量(70年及び97年)です。出典はERS/USDA(米農務省)「Food Review」です。
約25年の間に、どんどん牛乳が飲まれなくなっています。何とかしたいと考えたカリフォルニア州牛乳加工業者協会はCMを制作します。
さて、皆さんなら牛乳の消費量を増やすために、どのような広告を制作しますか?
牛乳は健康に良い。牛乳はカルシウム取れるから良い。牛乳は楽しい。牛乳飲むと気持ちが和らぐ。
全部、バツです。機能面・情緒面に訴えても、「理解」されても「行動」に繋がりません。
正解はクッキーの広告を作る、なんです。クッキー食べてたら、牛乳欲しくなりません?
あるチームが、牛乳を普段飲んでいる人に、あえて牛乳を飲まずに暮らしてもらって、「牛乳欲しくてたまんない!」という場面を全部書き留めてもらったんです。飢餓テストといって、普段の関与度が低いものをわざと取り外して、本当に求めていることを明らかにする方法です。
そのテストのコメントには、チョコチップのクッキーを食べて直ぐに「あ、おれ、牛乳飲んじゃいけないんだった!」と気付いて、口の中がモソモソして辛い思いしたーというシチュエーションなどが書かれていたそうです。
そういうコメントをたくさん集めて、クリエイティブアイデアにしてるんですね。皆さんも口の中がもさもさする甘い食べ物を飲むと、飲み物が欲しくなりますよね?
だから牛乳を扱ったCMなのに、素材は「クッキーを食べて、口の中がもさもさするから牛乳飲もうとして…無いじゃん!」という内容に仕上がりました。
このクリエイティブで、カリフォルニア州の牛乳売り上げは上がったそうです。これが「インサイト」の力だと僕は思います。
さて、では、もう一度、この画像を見て下さい。
ところで、この折れ線グラフは、説明に適した表現でしょうか? ここで折れ線グラフを使うのは合っているんでしょうか。
今日はグラフについてお話します。
なぜグラフが必要なのか?
某・宇宙の帝王が「私の戦闘力は530000です」と言ったとき、どんなグラフが適切でしょうか。こちらでしょうか。
果たして、こちらは数字をグラフにしただけです。530,000だけですから、そもそもグラフにする必要はありません。
平均を添えてみました。あの時代の戦士たちの戦闘力ですね。平均的な戦士の能力を横に添えることで、私たちはフリーザもとい某・宇宙の帝王のすごさに気付くわけです。
では、こちらの表はどうでしょうか。経済企画庁「国民所得報告」から拝借しました。
「もはや戦後ではない」とは、1934年~36年の1人あたり実質国民総支出の平均を、1954年~55年に上回った時代を指します。もはや戦後復興による経済の成長は終わったのだ(戦前と同じまでに戻ったのだ)という意味を表しています。
では、続いてこちらを見てください。
データは同じです。表にするか、グラフにするかの違いです。果たして、どちらが見やすいでしょうか?
グラフには2つのメリットと1つのデメリットがあります。
1つ。図にすると覚えやすい。情報量は削ぎ落とさず、視覚表現量を減らして理解できます。数字を絵で表現できます。ただし数字をグラフにするだけではダメで、見て、覚えやすい工夫は必要です。
2つ。言葉にしなくても相手に伝えやすい。ルールが決まっているから万国共通です。国が違えば全く伝わらない、ということはありません。そもそもグラフは、データを一瞬で伝えるために誕生した道具なのですから。
なぜグラフは生まれたのか?
グラフは、スコットランド人のウィリアム・プレイフェアによって生み出されました。今から200年前のことです。
グラフは「The Commercial and Political Atlas」という本で初めて描かれます。この本、現代意訳すると「図解でわかる!統計データ」とでも申しましょうか。
そもそも、この時代に統計データを用いた経済状況の説明は「既にある本」でベタでした。既に1690年には「政治算術」という本が刊行されています。
それでは本が売れないと考えたウィリアム・プレイフェアは「グラフ」を差し込んで、分かりやすく表現することを思いつきます。つまりグラフとはもともと差別化のために生み出されたのがキッカケなのです。
本の冒頭には、以下のようなメッセージが掲げられています。
as much information may be obtained in five minutes as would require whole days to imprint on the memory, in a lasting manner, by a table of figures.
(表なら1日かかってしまうのと同じ情報の量を、5分で得られるようにする)
そのためにグラフは生まれたのです。
グラフのデメリットは何か?
誰でも、直ぐに、なんとなくそれっぽいグラフを作れます。グラフとは、好き勝手に描けるイラストとは違うのです。役割とルールが決まっています。コンサルの何とかテクニック論なんて各論にすぎません。
それっぽいグラフのいくつかを紹介しましょう。
オフィスの1階に東進があって、これひでぇなぁと思って写真撮りました。5000兆円欲しい!の元ネタじゃねーかなんて思ったりします。
数字は記載されているので、グラフで表現してみました。
17年から18年より、その1年前の方が伸びているわけです。でも、それを誤魔化すように、あえて3Dにして奥行きを持たせて、あたかも高いように見せかけている。高さも滅茶苦茶です。
これはグラフではありません。イラストです。
他にも、こんなグラフ。これはBBソフトサービス株式会社2014年ニュースから抜粋しました。
円グラフって、何かね…という感じですよね。
他にも、ソフトバンクモバイル株式会社新商品発表会 「2013 Winter - 2014 Spring」から抜粋しました。
棒の高さが明らかに変ですよね。「高さ偽装」と呼んでいます。
こうしたグラフは、何も日本に留まりません。世界において共有です。
このグラフは、日本で言う観光庁に当たる、中華人民共和国国家旅游局のサイトで発見したグラフです。
円の中心が無いグラフを「ドーナツ」グラフと言いますが、それをさらにデータ項目単位で分割した、クソ見づらいグラフです。このグラフ、逆にどうやって作ったのか気になりますよね。
「グラフはイラストでは無い」の意味がお分かりいただけたでしょうか。絵を描いただけの図のなれの果てがこれらのグラフなんです。
グラフの持っている役割やルールを無視すると、こういう単なるイラストに堕ちてしまいます。
ちなみに、これアカンというグラフは「グラフ警察」が出動します。三重大学の奥村晴彦先生や、トランスコスモス・アナリティクス株式会社の萩原雅之さんや、他大勢の人が目を光らせています。
図の役割・ルール
グラフには得意な表現方法があります。歴史的な経緯からして、その表現が得意だったりします。
例えば、先ほどの牛乳の折れ線グラフ。
このグラフは、何を見せたいのでしょうか。「全米における1人あたりの飲用牛乳消費量(70年及び97年)」ですから、70年~97年までの推移では無いはずです。2地点のデータしか無いのですから。
こちらが正解でしょう。2地点を見比べるなら棒グラフが正解です。棒グラフの一番得意な表現方法は比較です。それに棒の高さを比べて、量の違いを把握できます。
次に、こちらはどうでしょう。M-1グランプリの審査員得点の年毎平均点です。このグラフで「難易度がどんどん高くなっている」と言われたら、どう思いますか?
ちょっと「?」となりますよね。「どんどん高く」は推移を表していると思いますが、果たして棒グラフで表現するのが適切なのでしょうか。
2001年に始まり、折れ線は一貫して右肩上がりです。ここ2~3年は、M-1第1期の前半・中盤と比べても、相当難易度が高いと分かります。折れ線グラフはある時点とある時点の間の傾きから変化を把握できるからです。
また、折れ線にすれば、2011年~2014年の「空白の4年間」も見えてきますね。
ちなみにですが、M1グランプリに行こうとしている方がいらっしゃったら、以下のグラフを見てください。
各審査員の得点を散布図で表現しています。
大吉さんと小朝師匠は手堅く狭い範囲で得点付けしているのに対して、巨人師匠、リーダー、松本さんは幅広く得点付けしています。言い換えれば、巨人師匠かリーダーか松本さんにハマった方が、高得点になりやすいのです。
閑話休題。次は円グラフです。
模倣品・海賊版対策の相談業務に関する年次報告(2016年、2017年版)からの抜粋です。改めてですが3Dグラフ…みづらいですよね。この講演をキッカケに少しでも3Dグラフがなくなれば幸いです。
ですが、そもそも3Dに限らず、円グラフは作ってはならないのです。円グラフは円の内角360度をデータ量割合に応じて、面積を分割します。
しかし実際目が向くのは面積です。角度ではありません。そうなると、実感より1.2倍程度、誤錯覚が生じます。
もう1つデメリットがあります。円で表現されると、時系列の推移がわかりません。年単位で「円」を描くのでしょうか?
円グラフは総じてデメリットしかないのです。
こんな円グラフを作ったのも、またウィリアム・プレイフェアです。ただし最初は「棒の代わりに円グラフ」を用いていました。円の大きさが量を表していたのです。
内訳を表す今の表現方法が生まれたキッカケは定かではないのですが、それは白衣の天使・ナイチンゲールではないかと勝手に考えています。
ナイチンゲールは、イギリス統計学会に所属する統計家です。彼女は、「イギリス陸軍の保健と能率と病院管理に関する覚書」と題した資料の中で、クリミア戦争の負傷兵たちの死亡原因を表すグラフを作成しました。
1年を12等分した円グラフです。1854年4月から1856年3月までを表しています。一番外側の緑は伝染病での死者数、真ん中の黒はその他、一番内側のオレンジは負傷による死者数を表しています。
これ、面積=数量ではありません。半径の長さ=数量なんです。すなわち面グラフを円にしたようなものなのです。このグラフあたりから、円の大きさではなく、円の内角で量を表現する方法が現れます。
このグラフ、面の大きさがデータ量の大きさだと誤解しますよね。違うんです。半円の長さなんです。おそらくナイチンゲールはあえて錯覚するような円グラフに仕立てたという説もあります。
図が持つメッセージ性
このグラフの違いは、どこにあるでしょうか。ちなみに両方のグラフとも同じデータから作成しています。年単位で集計しているか、Q単位で集計しているかの違いでしかない…ように見えません。
では、以下のグラフはどうでしょうか。
グラフのタイトルを「今年1年頑張りました!」に変えてみました。グラフの見方が大きく変わるとは思いませんか?
ちなみに右側だと「せやなぁ」ですが、左側だと「ちょいちょい待ち」となりそうです。
言いたいことを伝えるのもグラフの役割です。数字を読み解いた結果、伝えたいメッセージがあるからグラフを用いるのです。
ちなみに、上の2種類のグラフの場合、言いたいことや都合の良いことをグラフにしているだけだろ!というツッコミがあるかもしれません。半分正解で半分不正確です。
なぜなら、言いたいことや都合の良いことはグラフだけに限らず、数字でも作り出せるからです。
こちらは2016年国連世界観光機関(UNTWO)を参考にして作った国際観光客到着数ランキングです。日本は世界15位、アジア5位に位置しています。観光庁のHPにも掲載されているでしょう。
このグラフ、よーく見てください。何か違和感を抱きませんか。
香港が独立して描かれています。では、中国の約6000万人いる観光客到着数に、香港分は含まれていないのでしょうか?
中華人民共和国国家旅游局を参照して、2015年~2017年の内訳を調べてみました。なんと、香港人、マカオ人、台湾人は国際観光客到着数にカウントされていました。パスポートの問題でしょうか?
純粋に他国からの訪問より、まだ香港からの訪問が多いようです。となると先ほどの国別比較で見比べると、実質的な中国の順位は日本より下だとわかります。
ちなみに日本は、2013年以降、大幅に外国人観光客が増えています。
観光庁のデータから訪日外国人数推移と内訳を作成してみました。その内訳は80%以上がアジア圏となります。それ以外のアメリカ、ヨーロッパ、アフリカ圏からの流入数はそこまで増えていません。
アジア圏の中でも、その半数以上は積み上げグラフの下から韓国、中国、台湾の3か国で占められます。海外旅行といえど、近隣が大半のようです。
果たして、そんなものなのでしょうか?海外旅行者数世界1位のフランスを見てみましょう。
国連世界観光機関(UNTWO)によると、全体の80%がヨーロッパ圏からの訪問客でした。そもそも海外旅行の5分の4は、旅行者自身の居住地域内で行われます。
日本人の5分の4はアジア圏から出ないし、だからこそフランスに訪れる80%はヨーロッパ圏内なのです。
実はフランスは、ヨーロッパにおける日本の熱海・箱根的な存在で、休むために何なら日帰りで訪れるような場所なのです。
したがって、目下のフランスの悩みは「観光客が多い割にそんなに金使ってくれない」という点です。
国連世界観光機関(UNTWO)のデータから、外国人観光客数と、観光客がどれくらいお金を使ったのかを意味する観光収入による散布図を作成しました。
これを見れば、数ではフランス>スペインなのに、使った金ではフランス<スペインだと分かります。
東京を起点に考えれば、フランス=熱海・箱根、スペイン=北海道・大阪みたいなものですね。
近くの国はそこそこ金を使うが、遠くの国はがっつり金を使う。よくよく考えれば「そらそうや」と言いたくなるデータがあります。
日本における国別平均宿泊数と総利用額の散布図です。フィリピンは出稼ぎに来ている可能性があるのでわきに置くとして…。
韓国グループ、アジア圏グループ、アジア圏外グループの3つに分かれます。泊まれば泊まるほど使う金は増えるし、宿泊期間が長い国=アジア圏外グループだと分かります。
そんな中、中国が特例のように「アジア圏外グループ」にいます。しかも、その数は年々増えています。アジア圏の人の5分の4はアジアに旅行すると考えると、ますます中国からの観光客が増えるでしょう。しかも金を使ってくれる。
これはちょっとした確変モードなんだと分かる。
ここまで数字に潜って考えれば、このグラフに何の意味があるか?と思ってしまいますよね。
言いたいことを伝えるのもグラフだと言いました。要は、数字の「意味」を理解してグラフにするべきなんです。ただ「グラフ」にするだけなら誰でもできます。
「数字」の意味を解釈して、伝えたいメッセージに焦点を絞り、グラフにする。この場合は誤魔化しようがありません。
大事なことは、「数字」の意味の理解なんです。
まとめ
グラフの歴史や得意な方法については、以下本にもまとめていますのでご覧いただければ幸いです。
グラフを作るうえで重要なことは、絵で表現されている(≠イラスト)こと。伝えたいメッセージがあること。
この2つです。この2つさえマスターすれば、8割は伝わります。
1本書くのに、だいたい3〜5営業日くらいかかっています。良かったら缶コーヒー1本のサポートをお願いします。