見出し画像

「データ思考入門」

「データ思考入門」(荻原和樹 講談社現代新書)

東洋経済オンラインの特設ページ「新型コロナウイルス 国内感染の状況」を運営し、現在はGoogleでデータの読み方や伝え方のトレーニングを行っている著者による、「データ思考法」を解説した本。このサイトを作った人である。

本の帯には「統計や数字に強くなる」と出ているが、数学・統計や技術的な話よりも、データに向き合う心構えに重点が置かれていた。このような本はあまりないと思うし、非常に面白いと思った。アマゾンで「ギフトとしてよく贈られている商品」との表示が出ているが、たしかに多くの人に読んでほしいと思う内容である。

 これらの技術進歩によって、データ可視化を私たちが見る・作る機会は大幅に増えました。しかしその一方で、制作が簡単になったことで不適切なデータ可視化を見ることも多くなりました。目盛りを無闇に省略したり、自説に都合のよいデータだけ抜き出したりするなどして、私たちの印象を不当に操作しようとするものです。
 最近では「フェイクニュース」という言葉に代表されるように、誤った事実があたかも正しいかのように吹聴されることが増えました。これはデータでも同様です。データ可視化の制作が容易になったことは、裏を返せば専門家でも何でもない人がデータ可視化を作れるようになったことを意味します。その結果、まるで客観的な事実を提示しているかのように見せて偏った印象を披露するデータ可視化がSNSで広くシェアされることも増えたように思います。
 私たちがこれに対抗するためには、データのリテラシーを身につけることが不可欠です。それを本書では「データ思考」と呼びます。データ思考を高めるには、そもそもデータをどのように可視化し、どう提示すべきかを学び、「作る側」の視点を学ぶことが最も重要だと考えています。危ういデータ可視化があふれる現代だからこそ、私たちはデータ可視化に関する知識を身につけて騙されないようにしなければいけません。(24-25ページ)

 データ可視化と一口に言っても、その目的や背景によって重視すべきポイントは様々です。特に重要なのが「伝える相手の範囲」です。(中略)私は大きく3段階に「伝える範囲」を分けて考えています。
 1つ目は「自分のため」のデータ可視化です。(中略)
 2つ目は「組織のため」のデータ可視化です。(中略)
 最後に「社会のため」のデータ可視化です。(中略)
 本書で扱うのは主に「社会のためのデータ可視化」です。私自身が報道分野でデータ可視化を扱ってきたこともありますが、何よりも社会のための可視化は3つの要素をすべて必要としているからです。データを自在に操作することができる柔軟性、簡潔にメッセージを伝えるシンプルさももちろん求められます。また、人にデータを「伝える」際には興味のない人にも興味をもってもらう、データから導ける結論の重要性を理解してもらうといった、まさにナイチンゲールが行ったような説得の工程が必要です。それらの要素をすべて満たし、可能な限り多くの人々にデータを伝えることを本書では目指します。(32-36ページ)

 ここまで解説してきた細かな確認によって、徐々にデータが具体的なイメージを伴うものになってきたはずです。これらデータを読み解く作業の最終的な目標は「データと現実をつなげること」です。(48ページ)

 データは他の情報と組み合わせることで、思いがけない傾向が炙り出されたり、興味深い関係が示唆されたりすることがあります。一方で「データ可視化において2つ以上のデータを同時に提示することは、良くも悪くもユーザーに因果を強く示唆する」ということは注意しなければいけません。(50ページ)

 データ可視化において「どれだけ多くのデータをユーザーに見せるか」は、実は重要なポイントではありません。最終的にはユーザーがデータを理解したり、データについて新たな発見をしたりすることが目的のはずです。であれば、どれだけ多くのデータを見せるかは手段でしかありません。見せるデータそれ自体が少なくても、そこから得られる示唆や考察の総量を最大化することを目的とすべきです。(64ページ)

 私の経験上「面白いデータ」の条件は「何となく思っている仮説や疑問をデータで裏付ける」ものです。仕事でも日常生活でも、多くの人は「こんな傾向があるのでは」「この問題はここから起きているのでは」と、漠然とした疑問や仮説を持っています。こうした疑問や推測にデータで答えを出したり、あるいは裏付けたりすると、人に強い興味を持ってもらえたり、社会的に大きな反響があるものです。
 見方を変えると、データ自体の「面白い」「つまらない」の差はあまり大きくありません。人の疑問や仮説というニーズをうまく捉えることが「面白い」につながります。(72ページ)

 では、このようなデータを必要に応じて提示できるようにするのはどうするか。私の経験上、何かアイデアが浮かんでからデータを探すのでは時間がかかりすぎて機を逸してしまう恐れが強い。おすすめするのは、日頃から「データの引き出し」を作っておくことです。どこにどのようなデータがあるのか、大まかでよいので頭に入れておけば、何かニュースを目にしたときや、新しい可視化手法を知ったときにデータと組み合わせることができます。(75ページ)

 あなたがデータ可視化のコンテンツを社会に公開するとき、ページビューやシェア数といった「成果」を上げることは簡単ではありません。(中略)それでも、いくつかの工夫で注目を増やすことは可能です。
 まず第1に考えるのは公開タイミングです。データ可視化は時事的なトピックに対応しにくいということは、話題になったタイミングで素早く公開するのではなく、あらかじめ話題になりそうなタイミングを予測する必要があります。「いつでもいいから公開する」ことと「少しでも注目されそうなタイミングで公開する」ことには大きな違いが出ます。(中略)
 注目度を上げる方策の2点目が、画像をシェアしやすくすることです。
(182-185ページ)

 「何を可視化するか」と同じく「何を可視化すべきでないか」を考えることは重要です。私自身は、世の中にあるすべてのデータがオープンになるべきとは考えていません。差別や偏見につながる可視化に加え、公になることで特定の人々に不利益をもたらすデータもあります。(195-196ページ)

 データ可視化は「新しい情報かどうか」ではなく「何を伝えるか・何が伝わるか」が重要です。したがって、その可視化で使われるデータが他で公開されているかどうかにかかわらず、ユーザーにとって価値が発生したり、逆にこの破産者マップのように悪い意味で話題になることもあるでしょう。きちんと使えば社会的に大きな意義があることの裏返しとして、悪意のある使い方をすれば他人の傷つけることになります。「データを組み替えているだけだからこちらに責任はない」とは考えず、結果としてユーザーにどのような伝わり方をするかを考えることが重要です。(200ページ)

 ここまで様々な炎上の事例を紹介してきました。こうした炎上を避けるためには「データではなく、可視化によって伝わるものをベースにする」ことを考えるとよいでしょう。いかにデータに誤りがなかったとしても、差別やステレオタイプを助長するような伝え方・切り取り方は許されません。(204ページ)

 「データ可視化」の範疇には含まれないデジタル表現の例として、BBCはいくつかの質問に答えることでイギリスにおける自分の社会階級がわかるウェブサイトを立ち上げています。
 こうしたデジタル表現に対応することで、今までの新聞、雑誌、テレビに慣れ親しんでこなかった人々にも報道を届けることができるようになります。(222ページ)

 「行政機関の公開するデータはわかりにくい」とよく言われます。(中略)
 最大の理由は「行政機関はデータを編集できないから」であると考えています。第3章「データを編集する(理論編)」では、伝わりやすいデータ可視化を作るためにはデータを選ぶ・絞ることが重要だと書きました。一方で、行政における最優先事項は公平性と中立性です。統計データの中には社会的に注目度が高い/低いもの、経済や社会への影響度が強い/そうでないものなど様々あるでしょうが、「全体の奉仕者」たる公務員はそれを自分たちだけで判断できませし、すべきではありません。(中略)
 さて、社会におけるデータ活用の話になると「行政もデータ活用を推進してデータをわかりやすく発信すべき」という意見が見られますが、ここまで説明した公平性や中立性が失われるリスクを考えると現実的ではありません。ひとつの代替案は、行政と民間の役割分担です。データをあまねく日本全国から収集・集計することは、権限の面でもコストの面でも民間企業には真似できない、行政機関の役割です。行政機関はこちらに注力し、可視化や活用といった側面はある程度民間に任せる方法です。(224-225ページ)

この記事が気に入ったらサポートをしてみませんか?