見出し画像

データを通じて私たちが見ているもの

はじめに

 今回は、データ分析に関するノウハウについて書き残しておこうと思います。最初なので基本的なことをと考えていたら、バレーボールでなくても通用するような内容となってしまいました。それでも大切なことだとは思うので、お付き合い頂ければと思います。

“データ”は客観的だが

 数値で表された“データ”を扱うことの長所とは何かと聞かれれば、その客観性と答える人が多いと思います。確かに、2は1より大きく3より小さいです。そして、人の主観的な評価は、公平に判断していると思っていても、その人の思想信条やその時の状況など、様々な影響を受けてしまいます。データはこうした主観には左右されないという長所があるというのは、割と定着してきたように思います。

 しかし、タイトルにもあるように、私たちはデータを通じて何を見ているのでしょうか?

 例としてある試合でスパイクの決定率が50%だった選手を例に考えてみたいと思います。

 実はこの50%という客観的な数値だけを見ているようなケースはほとんどないといって良いです。私たちが見ているのは、客観的な数値そのものではなく、客観的な数値の背後にある選手の『能力』を見ています。

 “能力”とは何か

 能力とは何かをわざわざ説明する必要はないのかもしれませんが、PlayStationやSwitchのスポーツのゲームをイメージしてみてください。バレーボールのゲームは少ないので、野球やサッカーのゲームをイメージすると良いかもしれません。

 こうしたゲームに出てくる選手には、スピードやパワーといった様々な能力に数値が割り当てられています。多くの場合、こうした能力は可視化されており、場合によっては編集も可能です。そして、選手たちはゲームの上でこの数値に応じた動きをします。

 では、現実の世界ではどうかというと、選手が能力を持っているということに疑いを持つ人はいませんが、ゲームのように直接観測することはできません。そのため、能力が反映されたものを観測し、それを間接的な能力として見ています。スパイクの決定率の場合、決定率が何%かという客観的な事実よりも、その選手のスパイクを決める能力がどのくらいなのかということを見ているわけです。

画像1

 今回はスパイクの決定率という選手個人の技術指標を例にあげたので、背景にあるものが選手の能力になりましたが、仮にトラッキングデータなどで測定された位置情報や、ビデオで撮影された映像(これもデータの一環)も、データそのものではなく背景にある戦術的意図や、選手の技術(≒能力)といった、本来見えないものを見る(推測する)という意図のほうが大きいと思います。

 純粋に客観的な情報としてデータが求められるようなケースは、例えばクイズの問題の答えとして特定の数値が出題されるようなケースくらいしか思いつきません。

データの信頼性と妥当性

 客観的な側面が強調されるデータですが、実際には私たちが見ているのはその背後にある能力といった直接観測することができないものです。そして、ここが大切なところですが、

 データの客観性は、背後にある能力の客観性や正確性を保証しません。

 データが客観的だからといって、データを通して見ている能力が正確なわけではないということです。したがって、データを得た際には、それが能力を正確に表しているかを吟味する必要があります。そこで大切になってくるのがデータの信頼性と妥当性という考え方です。

 データの信頼性とは、スパイクの決定率が50%の選手がいた場合、この50%を信頼できるかということです。例えば、次の試合では80%、その次の試合では20%と大きく変化するようでは、50%という成績をもってその選手の能力と判断することはできないと思います。

 スパイクの個人成績の場合、規定打数としてある程度の打数をクリアした選手のみランキングの対象とされています。スパイクの打数が少ない場合、成績は大きく変動しやすく信頼性に欠けるということが経験的に知られているためです。ただし、規定に到達することがデータとして信頼できるラインを超えたことを証明するものではありません。

 妥当性については、細かく言い出すといろいろあるのですが、ここでは、「そもそもスパイクの決定率が選手の能力を図るデータとして妥当か?」という問題と考えます。そう考えると、スパイクの効果率といった指標もありますし、もっと工夫の余地があるのも事実です。

現実では・・・

 こうしたデータの信頼性や妥当性は案外軽視されていると感じています。例えば、ある大会にチームが望む際、メディアは前回大会の順位までは到達できるだろうという前提を暗に持った上で話していると感じたことはないでしょうか。

 これも一種の信頼性の問題で、前回大会の順位にチームの能力が完全に反映されていると考えている。つまり信頼性を疑っていないということでもあります。しかし、前回大会には及ばずという結果になることは珍しくありません。

 また、残念ながらバレーボールのデータを分析する人の中にも、1試合かそこらのごく少ないデータを集計した結果から「これがエビデンスだ」という人もいます。これも信頼性を無視した例で、こういう人は、下手をすると、悪意を持って自分の都合の良いデータを広めたい可能性もあります。

 妥当性については無視されているというよりは、そもそも妥当性を疑うような習慣がなありません。

 しかし、例えば野球では既存の指標の妥当性を疑い、新しい指標を導入することでこれまで過小評価されていた選手を抜擢しチーム力を向上させた例があります。映画化もされたマネーボールに描かれているのはこういった話です。

 バレーボールでも野球と同じことが必ず起こるとはいえませんが、自分はこれを発展の余地があると考えます。妥当性に疑問を呈することは誰にでもできますが、そこから妥当性の高いものを作ることができれば、大きな利益につながります。

まとめ

 データを見ていく上で当たり前のことなのですが、案外見落とされがちな要素を紹介してみました。

 バレーボールとデータの関わりの歴史は結構長いと思いますが、特に日本において、注目されるようになってきたのは2010年に入ってからだと思います。世の中に新しいものが導入される過程において、その長所が強調されがちです。しかし、今回のように、データ自体は客観的であっても、それを通して見ているものは案外不確実なものであるということを認識しておくことが大切です。

 こんな感じで引き出しの中にあるノウハウを少しずつ紹介していけたらと思います。 

画像:いらすとや

この記事が気に入ったらサポートをしてみませんか?