棒グラフ

棒グラフは死ぬべき⁉

"Dynamite plots must die"
棒グラフは死ぬべき (意訳)
がタイトルのopen letterがツイッターで回ってきました。
棒グラフでは個々の情報が失われることが多い、正確に結果を伝えることができないと感じた件。
改めてやっぱりそうだよな…とこの記事を読んで感じました。
記事のページ (simply statistic) リンク

1.記事の概要(ざっくり意訳)

ざっくりした解釈でまとめます。信用できない方はソースをGoogle翻訳などにぶち込んでください。

1-1 現在の棒グラフの状況 

最新の科学雑誌Natureなどに掲載されている論文の85.6%で一つ以上の棒グラフが使用されています。
統計遺伝学の研究者Karl Broma教授は”もっともひどいグラフの一つ”として棒グラフを挙げています。また、別の研究者が2011年にはBritish Jounal of pharmacologyで”show date, don't conceal them”で棒グラフの問題を提起しています。
筆者らはデータを提示する際は箱ひげ図やヒストグラムなどで表示すべきだと考えています。

1-2 棒グラフの悪い点(具体事例)

棒グラフは2つのグループを比較するときに用いられます。

左の図、左の青い棒よりも右の青い棒の方が統計的に有意に高いと示した例です。各青い棒における、1つ1つのデータを表したものが右の図です。右の図で1つだけ高い値(黒い点)やデータの入力ミスと仮定しています。(実験方法、もしくは機械の不調など何らかの原因で正しく記録されなかったデータのこと)。

また他の問題点もあります。以下の2つの図を棒グラフで表すと、上の青い棒グラフと全く同じ形になります。

1-3 対策

筆者らはこれらの問題に対応するために以下の事を主張しています。
1. プロット(黒い点)と箱ひげ図をかく
2. プロット数が多い場合は箱ひげ図のみかく
3. ridge plotを用いる
などの方法と提案しています。

2.自分の感想

タイトルがとんがっていて面白かったのですが、本文にも面白い書き方がありました。

"First, if you have a print edition of your journal you are wasting ink. No need to waste all that toner just to show these four summaries:"

2-1 よく見かける棒グラフ

棒グラフは2つのグループを比較するときによく見かけるし、使います。
でも棒グラフは個々の情報が一本の棒とエラーバーにまとめられてしまいます。
他人のデータを読む場合でも、自分のデータを確認する場合でも、個々のデータを見ることで、異常な値を持つデータはないか確認することができます。(というのも自分が論文を読んだ時に、「こんな平均の値は自分のの実験だと出ないぞ…」と書き偽的になったことがあります)
すべてのデータがきれいになるわけがない
機械の性能テストなどは多少の差があれども、だいたい誤差なく収束するのが私のイメージです。
しかし治験の場合、車や機械の部品ではなく様々な個人差(身長・体重・これまでかかった病気など)を背景に持つ人が参加します。また、同じような条件で培養した細胞や同じ遺伝子配列をもつ実験動物でさえ、個体差があります。個体差のある集団においてデータを記録し、棒グラフという少ない情報でまとめて記載してもいいのでしょうか。

2-2 統計調査問題に触れたい(願望)

最近は統計や調査に関するニュースが多いので取り上げてみました。棒グラフはぱっと見て理解しやすものではあります。しかし情報があまりにも少なくなってしまいます。もし悪意やだます意思のある人がわかりやすいグラフを作り、安易にそれを信じてしまう人もいるかもしれません。そうならないためにも、ぼんやりとグラフ一つに対して様々な方法があるんだな、このグラフはこの情報が足りないなっと斜めに見ると楽しいかもしれません。

2-3 数学苦手でも手に取りやすい本

統計は名前的に数学アレルギーの方には受け付けられないかもしれません。しかし数式ばかりで解説していない本もあるので、書店とかでちらっとみてみるといいかもです。個人的に気になっている本は”データは騙る/ゲアリー・スミス著”の内容は読みやすいのかなっと感じました。NHKの番組でもやっていたのかな?私はちらっと書店で目を通しただけですが・・・。一応最後にリンクを張っておきます

2-4 理系で統計理解したい場合(でも数学嫌い)

理系で論文の中にある統計手法を理解さえすればいい!しかし数学アレルギーだ!という方にもいろいろな本があります。私は”数学いらずの医療統計学”という本を買ってみました。実際には使わないけど論文を解釈するのにはいいかなって具合です。医療系の本となってしまいましたが、他にも言葉でわかりやすく説明している本はたくさんあるはずです。本当は今話題の沖縄県民投票の”どちらでもない”についてどのように考えるかや、新聞などに書いてある世論調査を発表する場合は質問用紙も同時に公開すべきだとか書いてみたいのですが、専門でもなく、よく調べないといけないので挫折します!長い文章でしたがありがとうございます。


3. 引用・参考リンク

棒グラフに言及しているページ
https://simplystatistics.org/2019/02/21/dynamite-plots-must-die/
Karl Broma教授 プロフィール
http://kbroman.org/
British Jounal of pharmacologyで”show date, don't conceal them”
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3087125/
”データは騙る”のページ
http://www.hayakawa-online.co.jp/shopdetail/000000014133/
”数学いらずの医療統計学のページ”
https://www.medsi.co.jp/books/products/detail.php?product_id=3207

この記事が気に入ったらサポートをしてみませんか?