データの誤謬シリーズ（全15回）

本

” 誤謬（ごびゅう）とは、つまり、間違っていることである。” データにまつわる誤謬を紐解き、やさしく知るシリーズ

運営しているクリエイター: ダッシュボード研究所 📊 Dashboard社のCEOさん

#経営者

データの誤謬＃10 『平均への回帰』

レーダーチャートの生みの親は、え？ナイチンゲール！本題から、ズレすぎ疑惑あり。＃10 平均への回帰データに偏りがあったとしても、時間の経過や回数とともに平均値に戻っていくこと。結果に偶然の要素が含まれる場合、平均値に回帰する傾向が見られます。例えば、ビジネスでの成功は、自社の「実力」だけでなく、「運」にも左右されることは想像できるでしょう。平均回帰に当てはめると、現在最も優れた業績を上げている企業も、10年後には平均に近い業績になっている可能性が高いという

データの誤謬＃11 『シンプソンのパラドックス』

「平均値」ってよく耳にしますよね。どうしても、「普通」とか「中央値」という意味で連想しがちですが、それは思っているものとは違うかもしれません。真実はいつも・・・＃11 シンプソンのパラドックス全体で見るか？部分で見るか？分析の違いよって矛盾した結果が出てしまうこと。 1970年代、バークレー大学は、女性の志願者が男性の志願者よりも合格率が低かったため、性差別だと非難されました。しかし、問題の原因を突き止めようとしたところ、個々の学科で、女性の方が男性より

データの誤謬＃12 『マクナマラの誤謬』

フォード社長、国防長官、世界銀行総裁を務めたスゴ腕エリート「歩くIBMコンピューター」の異名をもつ超秀才とは？＃12 マクナマラの誤謬複雑な状況下で、指標だけに頼り、大局を見失ってしまうこと。 ”真実は、「数値的データ」と「統計的厳密さ」のみから見い出される ”と、信じて疑わなかったアメリカの国防長官ロバート・マクナマラ（1961年～1968年）さんにちなんで名付けられてしまった、なんとも不名誉な誤謬用語です。マクナマラさんは、ベトナム戦争において、敵の戦

データの誤謬＃13 『オーバーフィッティング』

人工知能とかけて、人間関係と解く。その心は？＃13 オーバーフィッティング手持ちのデータに合わせすぎて、一般的な傾向を表していない偏ったモデルを作ってしまうこと手持ちのデータにフィッティングし過ぎると未知データの予測精度は下がってしまうようなことが起きます。よくある例としては、AI(人工知能)で頑張って学習させて、本番になると、全く使えないじゃん（怒！）となるやつです。原因は、オーバーフィッティング。これまで学習してきたデータと同じような場合は精度

データの誤謬＃14 『出版バイアス』

皆さん、気づいてますよね？ネガティブな話の多くは、隠蔽されてしまうということを。＃14 出版バイアス面白い研究結果が発表されやすくなり、現実の印象が歪められてしまうこと統計的に有意な結果であれば、読んでいて面白い。だから、出版（公表）される可能性が高くなります。反対に、同様の研究が他にあったとしても，結論が出ないと出版は控え目。ネガティブな結果が出た研究も、同様です。つまり、出版・公表されている時点で、バイアスが働いてしまっているわけです。よって

データの誤謬＃15 『サマリー指標の危険』

データ視覚化の重要性を、”恐竜”で表す？新しいものを古いもので表現するセンスと発想が、なんともすばらしいと思いませんか？＃15 サマリー指標の危険平均や分散などのサマリー指標（統計量）だけを見てしまい、生データにある大きな違いを見逃してしまうこと平均や分散（標準偏差）、相関係数などのサマリー指標が同じだとしても、データセットの “形状” は、まったく異なることがある。これを実証するために、統計学者のFrancis Anscombe（アンスコム

データの誤謬シリーズ（全15回）

フォローしませんか？

#経営者

データの誤謬＃10 『平均への回帰』

データの誤謬＃11 『 シンプソンのパラドックス 』

データの誤謬＃12 『 マクナマラの誤謬 』

データの誤謬＃13 『 オーバーフィッティング 』

データの誤謬＃14 『 出版バイアス 』

データの誤謬＃15 『 サマリー指標の危険 』

データの誤謬＃11 『シンプソンのパラドックス』

データの誤謬＃12 『マクナマラの誤謬』

データの誤謬＃13 『オーバーフィッティング』

データの誤謬＃14 『出版バイアス』

データの誤謬＃15 『サマリー指標の危険』