見出し画像

筒井淳也『数字のセンスを磨く~データの読み方・活かし方』

☆mediopos-3029  2023.3.4

「エビデンス」という言葉をよく耳にする
(少しばかり違和感を感じたりもする)
「根拠」「証拠」といった意味である

「ファクト」という実際に起こった事実があり
「その事実を証明するための材料」として
「エビデンス」が位置づけられる

その際によく使われるのが「データ」である
その「データ」が提示されることで
「ファクト(事実)」が明らかにされたとされる

「データ」は多く「数字」で表され
それが否定し得ない「エビデンス」であるかのように扱われる

しかし数字は
物事を抽象化単純化したものであり
それそのものが「エビデンス」なのではない
ということを理解しておかないと
それによって導き出される「ファクト」とされるものを
疑い得ないものであるかのように思ってしまう

「数字が作られるプロセス」(数量化)や
その数字が比較され因果が関係づけられ分析されるプロセスを
理解しておかないと
「数字にできること、できないことをきちんと分別する」
ことができなくなるのである

だからといって「数字」を否定することも
また逆の無理解への道を歩んでしまうことになる

「「数字をそのまま受け入れる」ことも、
「数字を過度に受け入れない」ことも、
両方とも想像力の欠如の表れ」にほかならない

重要なのは本書のタイトルにあるとおり
「数字を扱う「センス」」を磨くこと」なのである

その重要性をふまえながらいえば
「数字のセンスを磨く」ことと同時に欠かせないのは
提示された「データ」や「ファクト」の背景にあるもの
あるいは提示さえされずに隠されているそれらをも
読み・活かすことのできるような
「センス」をも磨くということだろう

多くの場合
政治的意図によって
さらにはその意向を受けたメディア等によって
開示される/隠ぺいされる内容は
都合の悪い「ファクト」を見せないでいる
あるいはその理解を妨げる傾向を強くもっている
つまり「大本営発表」を
そのまま信じるわけにはいかないということだ

理解・判断のもとになる
「エビデンス」そのものが偏りすぎているばあい
「ファクト」は別の顔に見えてしまう
「リテラシー」は隠されているものや
偏向しすぎているものに対しても
有効なものでなければならないのである

■筒井淳也『数字のセンスを磨く~データの読み方・活かし方』
 (光文社新書 1241 光文社 2023/2)

(「はじめに」より)

「私は本書で、次の二つのことをお伝えしたいと考えています。
ひとつは、「数字にきちんと向き合ってほしい」ということです。もうひとつは、「数字にできないこと」を知ってほしいということです。

(・・・)

 「数字に何がわかるのか」という気持ちを、私たちは常に持っている必要があります。
 ただ、それでも私たちは生活をする上で数字を扱わなければなりません。その上で避けるべきなのは、数字が物事を単純化しているということを「忘れてしまう」こと、その上で逆に「問題があるからいっそのこと数字を扱わない」ということです。
 数字が作られるプロセスを忘れてしまうと、数字を間違って分析してしまうことにつながります。「無理して作った数字だ」ということを意識していれば、おのずと数字を扱う際にも一定の分別がなされるはずです。

(・・・)

 「「数字をそのまま受け入れる」ことも、「数字を過度に受け入れない」ことも、両方とも想像力の欠如の表れなのです。

 思えば、このような立場から数字や統計を解説した本は、驚くほど少ないものです。多くの入門書は、数字が作り出されるプロセス、そこに含まれる歪みについては、統計調査の文脈で一部だけを触れるか、あるいは「数字をそのまま受け入れ」ています。あとは手法の解説だけです。これだと、数字を扱う「センス」は磨かれないままです。

 ここでいう「センス」は、英語ほんらいの意味だと考えてください。(・・・)センスという言葉には、もちろん「感覚」という意味もありますが、「良識、分別、判断力」という意味合いもあります。これらには、「限界をわきまえる」といった含意があります。「数字のセンスを持つ」ということは、数字にできること、できないことをきちんと分別する、ということです。」

「本書では、「数」を使った実践を次の順番で説明していきます。まず、私たちはいろんなものを数に置き換えます(数量化)。たとえば、人々の幸せの度合いを数値化します。次に、数にした上でいろんなものを比べます(比較)。ある人は別の人よりも幸せである、といったことがわかります。そして、何かにその幸福度の差を生み出す効果があるのかを解明します(因果)。その際に、差が偶然に生じているものかどうかにも気を配ります(確率)。そのあとで、AIビッグデータという新しい計量分析の動向を踏まえて、データや分析において専門化が何をしているのかを解説します。

 それぞれの実践、段階において、数字を扱うセンス————良識、分別————が問われてきます。」

(「第一章 数量化のセンス」より)

「私たちは何かを数えるときに、何かしら目的があってそうします。そしてその目的にかなうくらいには、異なった物体・事柄は「そろっている」ということが、数を扱う際には根本的に重要な作業になってきます。」

「何かを「数え上げること」は、数えることの目的に即して、個体の特徴をそろえた上で行われるのでした。(・・・)

 私たちは、数え上げること(数量化)を行うときに、わりと「おかしなこと」をよくやっています。しかもそのことに気づいていなかったり、あるいは(専門家はそうですが)事情があって仕方なく不自然なことをやっていたりするのです。

 実は数量化のこの「不自然さ」に気づくことこそが、「数量化のセンス」を身につける第一歩なのです。」

(「第二章 比較のセンス」より)

「数量化は、いささか「仕方のない解釈」を含んでいるものです。つまり、何かを数字に置き換えようと思えばどこかにひずみが生じる、それを認識することが重要だ、ということでした。では、「比べる」ことについては、どのような心構えが必要になるのでしょうか。この章では、比較に関しても同様の認識が必要だ、ということを論じます。

 まず、比較は面倒で難しい作業です。いろんな条件をそろえないと、意味のある比較はできません。しかし他方で、あまりそろえすぎてしまうと、別のところでそろわなくなるというやっかいなパラドックスがあります。最後に、こういった難しさがなぜか数字の場合は認識されにくい、という問題があります。」

「私たちは通常、ある概念をそれと関連する概念と関わらせて理解します。そして実際の行動や社会の仕組みも、この概念連関を反映しています。ただ、ある概念、あるいはそれを表現するための言葉は、周囲の文脈を離れて漂うこともあります。

 この傾向は、自然言語よりも数字において顕著です。数字には奇妙な魔力があります。数字がいったん示されると、その数字が算出される際の複雑な思考と作業、それらと結びついたいろんな概念が背後に隠れてしまい、シンプルで解釈の余地がないものとしてみえてしまうのです。」

(「第三章 因果のセンス」より)

「因果を数量的に捉えようとするときにどういう〈分別=センス〉が必要になるのか、について考えてみたいと思います。」

「どういった場合に因果効果を考えることが、そもそも意味を持つのか、ということについて考察した文章は、少なくとも一般向けとしてはほとんど存在しないのです。」

「何らかの原因が因果効果を持つのかどうかを追及することの極意は、その原因が施される場合とされない場合の、原因以外の条件をとことん同じにすることにあります。二つのグループをランダムに分けることが、その究極の方法である、ということでした。ただ、この「原因以外はできるだけ同じにする」という手続きを突き詰めれば突き詰めるほど、原因として考えることのできるものの内容が限定される、という処置のジレンマがあるということも指摘しました。」

(「第四章 確率のセンス」より)

「どの会社に就職するか、どの人と結婚するかといった大きな選択も、新発売のアイスクリームのたくさんのフレーバーのうちどれを選ぶのかといった小さな選択も、多かれ少なかれ賭けの要素があります。株価や為替、流行といった経済・社会的な現象にも、やはり偶然(たまたま)の要素はついてまわります。

 こういった社会・生活のなかの確率現象のことを、ここでは「自然発生的偶然」と呼んでおきましょう。その反対が「人為的偶然」です。人為的偶然は、サイコロやコンピュータなどで意図的に作り出す偶然です。」

「人為的偶然と違い自然発生的偶然には、何らかのかたちで「偏り」が入り込みやすい、という特徴があります。だからこそギャンブルでは自然発生的偶然はふつうは使われませんし、逆にスポーツは自然発生的偶然を残すことで「運と実力」がミックスされた状態を作り出すのです。」

(「第五章 分析のセンス」より)

「データは、「構造化」されたデータと構造化されていないデータ(「非構造化」データ)に分けることができます。構造化されたデータとは、何らかの規則性をもって整理されているデータです。これに対して非構造化データというのは、さしあたりそれ以外のその他の雑多なデータ、あるいはその塊だと考えましょう。」

「データの構造と大きさは、分析方針と結びついています。構造化されたデータと非構造化データでは、分析の方針や方法がまったく違います。

 自然も社会も、そして人間の頭の中の構造も、そのままでは雑多で構造化されていない状態を多く含んでいます。(・・・)多様な要素が不規則に絡み合っているからこそ、現れてくる現象が偶然にみえるのです。これを観察し、分析することで構造化されたデータを作り出すわけです。」

「解釈できないものを含めて無限の組み合わせから予測に使えるモデルを組み立てるのが機械学習の手法(正則化、リッジ、LASSO等)で、理解できる範囲の組み立てしか扱わないのが要約のための手法(回帰分析やログリニア分析)である、と整理できるでしょうか。
 ただ、厳密には予測と要約(記述・解釈)の境界線が明確ではないこともあります。」

(「第六章 数量化のセンス再訪」より)

「統計学では、観察されたデータを何らかの要因で説明した後の残り(誤差)に、個体ごとの何らかの相関がある場合、サンプルサイズを過大に評価しないで割り引くという決まりがあります。この相関には、時間による相関(系列相関)、空間による相関(空間相関)、その他の個体の相関(個人、自治体、国など)による相関があります。」

(「おわりに――数字に取り囲まれながら生きる」より)

「私たちは数字を駆使して、以前よりも圧倒的に安全で豊かな環境を作り上げました。数字の駆使がなければ、私たちの経済活動の基盤が失われてしまいます。しかし数字で規定されたその環境は、いったん出来上がってしまうと、なんとも不自由な「枠」として私たちの行動を縛ることがあります。」

(「あとがき」より)

「アメリカの作家マーク・トウェインが広めたといわれている諺に、「ウソんは三つの種類のものがある。ウソ、最悪のウソ、そして統計だ」というものがあります。ジョエル・ベストの有名な本のタイトルは、『統計はこうしてウソをつく』です。もちろん、統計がすべてウソというわけではなく。統計には「信じられやすいわりに、いい加減なものが混ざっている」といったことなのでしょう。

 数ある「統計のウソ本」は、広い意味での「リテラシー教育」としてみることができます。要するに、「正しい数字の見方を身につければ、ウソを見破ることができる」という趣旨なのです。」

「肝心なのは「データのウソ」を暴くことではありません。データの作成や分析を特定のやり方で行うこと、あるいは提示されたデータや分析を読み解く際の限界と意味を、その都度丁寧に考えることなのです。」

◎ 目次
はじめに
第一章 数量化のセンス
第二章 比較のセンス
第三章 因果のセンス
第四章 確率のセンス
第五章 分析のセンス
第六章 数量化のセンス再訪
おわりに――数字に取り囲まれながら生きる
あとがき

◎ 著者プロフィール
筒井淳也(つついじゅんや)
1970年福岡県生まれ。一橋大学社会学部卒業。
同大学大学院社会学研究科博士後期課程満期退学。博士(社会学)。
現在、立命館大学産業社会学部教授。専門は家族社会学・計量社会学。
著書に『制度と再帰性の社会学』(ハーベスト社)、
『親密性の社会学』(世界思想社)、
『仕事と家族』(中公新書)、
『結婚と家族のこれから』(光文社新書)、
『社会を知るためには』(ちくまプリマー新書)、
『社会学―非サイエンス的な知の居場所』(岩波書店)などがある。

この記事が気に入ったらサポートをしてみませんか?