#NulNote 基準無きデータの読み解き方 なぜダブルスタンダートは生まれたのか?

1か月ぶりの更新です。
ということで明けましておめでとうございます。
本年もゆるりと書きますのでよろしくお願いしますね。

さて、早速ですが先日同じ媒体内にて2本の記事がアップされました。
Twitter上のツイートを貼ってみます。

データ元はいずれもパリーグTVさんが集計した「ストレートでの空振り率」になるのですが、記事から読み解いてみると、規定投球回到達者のストレート空振り率は
H和田10.7%
L菊池7.7%
E則本7.4%

であり、規定投球回数未達である大谷は11.2%である
ということのようです。

さて、それを踏まえ改めてこの2本の記事を読み比べてみます。

データでひも解く日ハム大谷 数字で見ても凄い“リーグNO1”の球種とは?

https://full-count.jp/2017/01/13/post55220/
(以下上記記事より抜粋)
・今や球界を代表する投手となった日本ハム・大谷翔平。165キロという日本球界最速の剛腕を誇り、スタジアムを沸かせてきたが、そのストレートはデータから見てもやはり、図抜けているようだ
・総投球数2229球の大谷はストレートを1211球投げ、そのうち空振りを奪ったのは136球。空振り率は11.2%にあたる。規定投球回到達者でトップのソフトバンク・和田(10.7%)に0.5%差、続く西武・菊池(7.7%)らには3.5%以上の大差がついている。

165キロ大谷に肉薄 ホークス和田の“遅くて速い直球”がスゴイ

https://full-count.jp/2017/01/14/post55259/
(以下上記記事より抜粋)
規定投球回に到達した投手で、和田はストレートの空振り率が1位にランクしている。総投球数は2600球でストレートは1366球。うち146球が空振りで、空振り率は10.7%にあたる。
・この数字、驚異的と言っていいだろう。和田のストレートといえば、常時140キロ前後で130キロ台を計測することもある。規定投球回に3イニング届かなかった日本最速165キロの日本ハム・大谷は11.2%だから、わずか0.5%しか変わらない

まず大谷翔平の記事では11.2%の空振り率、そして規定投球回到達者でトップの和田毅との差が0.5%であることを挙げた上で、
「大谷のストレートは図抜けている」
という表現をしています。
ところが和田毅の記事内では10.7%の空振り率規定投球回到達者で1位であることを挙げた上で、大谷翔平との差については
「わずか0.5%しか変わらない」
という表現になっています。

さてこの0.5%は大差なのかわずかな差なのか…
結論から言うと「これだけではわかりません」と言うのが正確だと思います。

まず「ストレートの空振り率」というものは打率や防御率などのようにタイトルでもないですし、継続的にデータを提示されているものでもありません
打率なら「3割以上で優秀」、防御率なら「先発で2点台なら上出来」と言うぼんやりとした基準が長年のデータから導かれていると思います。なので打率3割を記録すれば「今年はよくやった」となりますし、防御率4点台なら「今年は良くなかったな」とすんなりと評価が下せるわけです。

ところが今回のように「大谷翔平のストレートの空振り率が11.2%である」というデータだけ目の前に出されたとして、すぐに何らかの評価が下せるでしょうか?
「…10%以上空振りを取れているなら凄いような気もするけど所詮1割でしょ…? でもストレートって一番球数多そうだからそのうちの1割というと優秀な気もするし…むむむ??」
とならないでしょうか?
これはなぜかというと、先ほどのように「長年の統計による優劣の基準」が存在しないからです。

ですから、そもそも10%の空振り率が例年のトップレベルと比べてどうなのか空振り率の差はどれくらい付くものなのかと言った「何らかの基準値」を提示しないと、このように0.5%の差が大差と書かれたり僅差と書かれたりしてしまうのではないかと思います。

データの読み解き方としては非常に興味深い内容なのですが、基準となる統計データがあった上で評価を行わないと、このようなダブルスタンダートな状態が起こりうるということかと思います。
皆さんも何かデータを評価する際には単に数字を並べるだけでなく何らかの評価基準をしっかり提示するように心がけると、より信頼性の高い考察になるのではないかと思います(自戒を込めて)。
そんなところで。

この記事が気に入ったらサポートをしてみませんか?