見出し画像

『データ分析読解の技術』内容紹介、目次

 3月9日に拙著『データ分析読解の技術』(中公新書ラクレ)が発売になりました。遅ればせながら、こちらで本書の内容と細目次を紹介したいと思います。

内容紹介

 本書は、メディアなどを通じて世に流通する怪しいデータ分析に抗するための読解力を、「問題」と「解説」を通じて習得する、鍛える本です。この「世に流通する」には、自身がやってしまう間違った分析も含まれます。データ分析を受け取る側、生産する側双方が、本書の想定読者になります。

 現在、行政、メディア、SNSなどさまざまな経路でデータやその分析が流通しています。しかし、その一定数は適切に数字が扱われおらず、我田引水や自画自賛のためにデータが利用されていることも多いのが実態です。

 なお、ここで言うデータ分析には、簡単な散布図やクロス表、ランキングや統計の数字そのものなど、何らかのデータと分析を根拠とした議論、主張すべてを含みます。

 こうしたカジュアルに流通するデータ分析は、余程注意していないと騙されてしまうことがあります。実は○○に関するデータでは作られていなかった場合でも、「○○ランキング」として発表された表や記事を真に受けて議論してしまったり、というように。

 こうした怪しいデータ分析にうっかり騙されてしまうのは、それらの多くが僅かな情報しかわれわれに伝えないことが背景にあります。逆に、そのごく僅かな情報を注意して読めるようになれば、怪しい分析に騙されにくくなり、批判や反論を行うことに繋がります。

 このごく僅かな情報とは、分析者や分析利用者の主張と、これを支える何らかの分析結果です。本書ではこれを「議論と数字」と表現します。この議論と数字の間にズレがないか注意深くなることが大切なのです。

 そのうえで重要となるのが「因果関係」です。分析対象の現象を作り出している因果の構造を広く深く探ることができれば、提示された分析結果と主張との関係を崩すことができるからです。

 まとめると、「議論と数字のズレに注意しながら因果関係を考察する」ことが、本書が示すデータ分析読解の基本になります。本書では8つの章に分けて基本的な思考法や技術を紹介していきます。

 さて本書は、このデータ分析読解の基本を紹介することが最終目的ではありません。お読みいただいたみなさまのデータ分析に抗する力、読解力を高めることを最大の狙いとしています。そのために、失敗例を用いた「問題」を提示して、技術を実践する、思考する機会を各章に設けています。

 そして、大なり小なり思考していただいたところに「解説」を加えることで、さらなる理解を獲得し、データ分析読解の技術や思考法の定着を図ります。この際に、知っておいたほうが良い統計学に関する知識も紹介いたします。しかし、基本は「習うより慣れよ」です。

 具体的な出題内容は下記の細目次をご覧ください。だいたいはメディア等で流布されたごく簡単なデータ分析、データを根拠とした何らかの主張を批判的に読み解いてもらう感じになります。

 慣れない人にとっては難問もありますが、だからこそ、データ分析を読む力が向上するはずです。試験とかではないので、気軽に頭を使っていただければと考えています。

 お読みいただければ幸いです。

目次

はじめに 怪しいデータ分析への処方箋
首相演説に見るデータ分析の怪
分析の失敗に気付くのに高度な統計学の知識は不要
失敗例で“相馬眼”を鍛える
本書の目的と構成――議論と数字のズレに注意しながら因果関係を考察する
本書の読み方――立場や目的に応じてご随意に
   ※アマゾンなど各書店でこの「はじめに」を試読できます。

第1章 データ分析読解の基本、因果関係
    ――対象に関する知識と想像力の重要性
因果関係の探索が問題を解決に導く
テレビで交通事故のニュースが増えたのはなぜ?
  ――要因を探る練習問題
「原因」、「理由」探しをしてはいけない
先入観、固定観念が問題解決を遅らせる
問題の因果構造を探る=現象を理解する
因果構造を広く探っていくコツ
データ分析の最高の味方は現場の知識

第2章 怪しさを感じ取る糸口、議論と数字のズレ
    ――分析を間違いと判断する手順
データ分析の弱点:議論と数字のズレ
ニュースになる交通事故は死亡事故だけではない
「怪しい」と気付くことは「間違い」と判断するための種
美容院が多い県の住民は見栄っ張り?
  ――議論と数字のズレについて考える練習問題
怪しい数字に“感付く”方法
「怪しい」数字を「間違い」と判断する枠組み:自説とその根拠
東京都民は恥知らず?――①焦点となっているデータを観察する
都市部で美容院が少ないのはなぜ?――②数字の因果構造を探る
相関関係の確認に便利な散布図――③データを分析する
データ分析の基本:相関関係を自説の根拠に
議論と数字のズレに注意深くなれば、怪しい分析に騙されにくい

解説:相関係数

第3章 結果論は分析ではない
    ――データから要因を探る技術と方策
要因の決めつけは問題解決に繋がらない
男性が特定地域で「余る」のはなぜか
  ――説得的な要因を探索する練習問題
要因を探る基本は相関関係
別の結果に置き換えて要因を考える
単位を細かくして観察すると、要因候補が見えてくる
工場が未婚男性増加の理由?
地域データと個人データの相違
「男余り」率と男性未婚率は異なる
余計な指標は現象理解の邪魔になる
データ分析は難しい=データ分析批判は簡単

解説:生態学的誤謬とシンプソンのパラドクス

第4章 データが歪めば結果も歪む
    ――分析対象とデータの取り方に注意する
『鬼滅の刃』人気投票の“意外”な結果
投票の時期と方法がランキングに影響を与える
データが歪むことは避けられない
若い層ほど安倍政権への評価が高い?
データの歪みに騙されないためには
病院での調査で一般市民の新型コロナウイルス感染率がわかる?
  ――データの歪みを考察する練習問題
データの歪みは補正できる・・・場合もある
データの取り方が補正困難な分析結果の歪みを生む
新型コロナウイルス感染と病院調査の関係
データが歪んでいても分析を諦めてはいけない

解説:無作為抽出の方法と実際

第5章 「分析したつもり」の落とし穴
    ――気が付きにくいデータの歪み
秋田県「移住者」増の怪
転入者の登録増が「移住者」増の背景?
データの歪みが分析結果に影響しない場合、影響する場合
安倍政権「地方創生」が生んだ鳥取県「移住者」急増
「移住者」が増えても人口減少は止まらない
施策を客観的に評価する意志を欠く行政
不毛な競争が生む「地方創生」の虚飾
次点で落選すると次の選挙で当選しやすい?
  ――「何を分析したつもりなのか」を考える練習問題
議論と数字のズレからデータの歪みを感知する
次回の当選できるかどうかの見込みが再出馬に影響する
次点バネの実際
前回落選候補の当選率が高くなるメカニズム
落選者数が偏るから「バネ」の印象が強くなる
根拠を疑う習慣を身に付ける

解説:生存バイアス
解説:平均への回帰

第6章 幻の因果関係を生み出す交絡因子
    ――三角関係を暴いて相手説を崩す
交絡因子で怪しい因果関係の主張を崩す
交絡因子を指摘する意義と限界
出所者が就職すれば再犯を抑制できる?
  ――交絡因子を探る練習問題
交絡因子を発見するコツ①…2つの因果構造を考える
交絡因子を発見するコツ②…逆方向の因果関係で捉えてみる
交絡因子を発見するコツ③…逆算して考える
要因と結果だけの単純なデータ分析にご注意を

解説:疑似相関

第7章 散布図に潜む罠
    ――分析の存在理由を問うことが大切
データの形式が偽の相関関係の出現しやすさに影響する
呟きが拡散された候補者が当選する?
  ――交絡因子のパターンを見つける練習問題
問題のヒント(1)参議院選挙の制度と結果
問題のヒント(2)ツイッターの仕組みと実態
候補の得票数を左右する要因は?
2つの因果構造を重ねて交絡因子を炙り出す
偽の相関が生まれやすい地域別集計データ
強力な人口と得票数の関係
「わかりやすさ」が間違いの元
ツイッター分析が流行した背景
成果を求める焦りや圧力が拙速な分析結果を生む
データ分析の存在理由を問う

補論 組織政党の選挙戦術とSNS戦術の相関
党の戦略が反映される組織政党の個人票分布
呟きが多ければ選挙戦で有利に?
データの密集が無相関を隠す

第8章 偽の相関、逆の因果と叫べば勝ちではない
    ――因果関係の丁寧な考察がデータ分析攻略の近道
交絡因子の強さとは?
難しい交絡因子の強さの評価
新聞を読むと学力がつく?
  ――交絡因子の強さを考える練習問題
拙速な批判言説を踏み台に考える
身の回りの“常識”に囚われず、因果の距離を意識する
札束は子供の学力を“直接は”向上させない
交絡因子と間接的要因は両立する
逆の因果関係は順方向の因果関係を否定しない
データ分析のとても残念な実情

ご購入

  • amazon.co.jp

  • e-hon

https://www.e-hon.ne.jp/bec/SA/Detail?refISBN=9784121507563

  • 紀伊國屋書店

  • honto

  • 楽天ブックス


関連リンク


ボツ原稿

 本書に収まりきらなかった原稿を公開しています。本書の雰囲気が掴めると思いますので、お読みいただければ。


この記事が気に入ったらサポートをしてみませんか?