見出し画像

データ分析って魔法のツール⁉

 前回の記事を投稿してから、あまり日は経っていないですね。もともと備忘録的な意味合いで始めましたが、これまで多くの方々に反響を頂きました。時には、アナリストらしからぬ気持ちの持ち方のような話をしたり、時には、単純に勉強の話をしたり。いつもお付き合いいただきありがとうございます!
 さて、今回は、アナリストならでは!という視点でお伝えしたいと思います。テーマはデータの活用です。
 ぜひぜひ最後まで読んでくださいね。

データ分析について語る前に

 先日、とある高校野球部にアナリストとして行ってきました。なんと、起業後始めての訪問でした。帰宅してから、今、この記事を書きつつ、いろいろと思考を凝らしています…。
 というのも、私自身すごく楽しかった。選手やスタッフの皆さんもすごく良い方で、感激しました。
 ただ、高校野球の水準に立ってデータ分析をしてみたときに、新たに気づくことがありました。その中で、自分の持っている最高のパフォーマンスでアドバイスをさせていただきました。
 その中で、気づいたことの一つ、「データ」についての考え方です。その高校の野球部の皆さんは、非常に高いレベルでデータを見ていました。そこで、改めて「データ」というものを見つめ、考えてみようと思ったのです。
 というわけで、書き始めたのがこの記事です。

「常識を疑え」

 桑田真澄さんの著書に、たびたび登場する「常識を疑え」というメッセージ。高校生の時に初めて桑田さんの本を読んだとき非常に感銘を受けました。
 その最たる例は、バントの有効性です。バントは、得点を挙げるために重要な作戦とされていました。得点期待値を計算すると、バントをすることによって下がることが明らかになりました。
 このような形で、これまでの常識が実は間違ったものであったというのは、野球に限らず多くの場面でみられると思います。(天動説と地動説の議論もまさにこの代表例。)
 ほとんどの場合、常識が覆される根拠は、数字です。科学の力の賜物ですね。なんと素晴らしい!こうして導かれる数字は、データの分析なくしてあり得ないものではないでしょうか。もちろんその背景には、テクノロジーの発展があり、学説の積み重ねもあるのですが。
 こんなに、ユーティリティなデータ分析を使わない手はない!データ分析ですべてが解決するんだ!そう思いましたか?

データが導かれる過程

 さて、データ分析と偏にいっても、そもそもデータ分析をしたことない人もいらっしゃると思うので、データが導かれていく過程を一般化してみたいと思います。おそらく、データ分析に従事している人は、無意識の中でもやっていることだと思いますが、あえてその点にも触れますね。データ分析をある程度できるようになった体で進めます。(まず、そのステップを知っていただきたいので)

1. 知りたいことを決める

 具体的に、「○○が◇◇になるから△△という結果が得られる。」というのではありません。こんなものを知れたらいいなとか、こう思うけど実際どうなんだろうといった具合の抽象度で構いません。

2. 既にわかっていることを整理する

 まずは、既知の事柄について調べ、整理します。自分自身でこれまでに分析した内容はもちろん、すでに明かされている方法について思考を整理します。例えば、セイバーメトリクスの一つである、WHIPについて自分のチームの投手でみてみたいとします。既に、昨シーズンまでの成績とWHIPについては求めてあると仮定します。その場合、もちろん昨シーズンまでのことについてもう一度作業する必要はありませんよね。そして、WHIPという指標はどのように計算するのか、どのような数値を示すことが理想なのかというのは、既に明かされていることです。
 このようにして、ざっくりとした知りたいことについてなんとなくやるべきことを明らかにします。

3. その分析の意図を明確にする

 データ分析をするうえで、使えるデータである必要があります。当然です。そのデータを求めることでどういう課題が解決するのか考えましょう。先ほどのWHIPを例に挙げます。あ、その前にWHIPとは何か、解説しましょう。WHIPは、以下の式で求められます。

WHIP = 与四球数 + 被安打数 ÷ 投球回数

 これには、デッドボールや野手のエラーは含まれません。1イニングで出塁を許す数を示しています。例えば、1であれば、1イニング当たり1人の出塁を許すということです。
 WHIPを求める理由は、「ピンチの場面で登板するのに適しているのは、誰かを調べたい。」という具合ですね。もちろん、奪三振率等ほかにも考慮する要素は多々ありますが、WHIPの役割の一つとして。ちなみに、他にもこのように、求めることがあると思いますが、そこには、1つの指標だけでいいということの方が少ないと思います。

4. 分析手法や図の見せ方を検討する

 前回から、WBCのデータばかりすみません。ここでは、World Baseball Classic 2023をすべての試合を通して投じられた4-Seam Fastballについての図も含めてご説明します。
 ここまでは、分析する内容について検討してきました。ここからは、実際に分析をしていくわけですが、分析をする方法と出てきた結果をどのようにして誰に示すかを考えなければなりません。
 分析する方法は、比較検討をするときに必要になります。ある一人の選手の1年前の結果と今の結果を比べるときやチームとして決めごとをする前後での成績を比べるときです。もちろん、それぞれを分析してみて、わかることもあると思います。ただ厳密にどのくらい変化しているのか、というのはその先に分析をする必要があります。先に挙げた例の場合、t検定を使おうとなるのです。
 何かと何かの関係性を見るときは相関分析、一つの結果を得るために、他のいくつかの要素がかかわっている場合は分散分析…など様々です。このようにして、その違いや調べたいことについて定量化することをお勧めします。もちろん、皆さんが完璧にできるとは思っていません(私もそうです。笑)。できることから始めてみるといいと思います。
 次に、結果の見せ方です。結果の見せ方は、大きく3つに区分できると思います。文字、表・図です。この順で、データを示される側の理解度が必要になります。文字というのは、得られたデータを読み解き、解釈し言葉にして伝えるということです。聞き手としては、わかりやすいですが、汎用性がありません。表は、数字を並べて示します。実際に数字で書いてあるので、ものによってはイメージしやすく見やすいものになります。ただ、見せるデータが多ければ多いほど難しい見せ方になるものです。そして、最後は図です。図には、さまざまありますね。マッピング、グラフ、フローなどなど。野球の分析に多く使われるのは、マッピングやグラフです。図は、たくさんの種類があります。どの種類を選ぶかによって大きく変わるものだと考えています。下の図を見てください。上が、散布図、下がヒートマップです。ともに、WBC2023の大会通して投じられたストレートを示しています。

散布図
ヒートマップ

 示したい情報は、「球速と回転数で見たときにどのようなストレートが多いのか」だとします。さて、見やすいのはどちらでしょう。この答えは、これをご覧のあなたに委ねます。

5. データをまとめる、整理する

 ここまでの手順を終えたら、75%くらいは終わりです。そのデータからいえることは何なのか。先ほどの「文字」の部分の重なりますが、より詳細に考えてみてください。得られたデータのもっとも重要な点はどこなのか。求めたいものは仮定した結果と同じだったのか、はたまた違ったのか。そして、一番大切にしていただきたいのが、そのデータがどこまでいえるものなのかです。というのは、サンプル数が少ないのに、あたかも一般の摂理であるかのように扱うのは好ましくないですよね。常にその点には気を付けていただきたいなと思います。

データ分析のエッセンス

 ここまでお読みいただいて、データ分析って長い長い手順だし、これができたら万事解決するに違いない。そう思いましたか?
 本題はここからです。今回は、データ分析についてのお話ですので、分析の部分までしっかりとお伝えします。先ほどの過程をお読みになってわかったと思いますが、データ分析で最も大切なのは、得られた結果への解釈です。5つのステップがあって、4つ目までにかかる時間はすべての中でも非常に長いです。しかし、データ分析のエッセンスはデータの解釈です。そのデータからいえることは何なのか、そのデータがをどう生かすのか。ここが最も大切です。

切り捨ててほしくない「感覚」

 ここで指す感覚は、指導者、選手の感覚です。アナリストとして、データが使えるようになった人として、一番やってはいけないのが、指導者や選手の感覚を切り捨てることです。データがすべて正しい、感覚なんてただの感覚だ。という考え方を持っていたら、今すぐ捨ててください。
 まずこの考えを持っているうちは、現場の人に認めてもらうことはできないでしょう。だって、そうしている人は現場の人間を否定しているわけですから、その応酬ですよ。もちろん、時には間違っていることもあります。データは、感覚の裏付けに他ならないと思います。こんな感覚でやっていたけど、実際のデータはこうだった。とか、データ通りの感覚です。というように照らし合わせることが非常に大切です。現場の「感覚」を一つの材料にしてデータを示す「感覚」を忘れないでください。

AIはアナリストの敵?

 最近は、ChatGPTをはじめ、AIの進化を見過ごすわけにはいきません。アナリストは、AIと隣り合わせの存在ですから、これからのアナリストの存在価値を脅かすものになるでしょうか。
 自分は、アナリストになって3年弱になりますが、アナリストという存在は今後増えていき、盛んな役職になってほしいと思っています。AIは今後も指数的に進歩するでしょう。であれば、あれは敵だ。ではなくて、それを生かしてもっとできることが増えるのではないかと考えたいですね。AIと同じスピードで、いやより速いスピードで私たちも進化し、人間にしかできないことを追求することは非常に大切なことです。それが、データ分析のエッセンスでもあり、今後アナリストが続いていく中で欠かしてはならないものであるはずです。

データ分析は魔法?

 さあ、今回のテーマに帰ってきました。改めて、あなたに問いたいと思います。「データは魔法のツールだと思いますか?」
 各所にデータを生かすという意図のワードをちりばめていましたが気づきましたか?ようやく伏線回収です。結論、決して魔法ではない。
 ここまでお読みになられたあなたなら既にわかっていることと思いますが、データ分析をして、何ができるか考えたときにそれだけでは何もなりませんよね。データ分析を生かして、選手を育てたり、感覚を裏付けたりするわけですから。そして、データ分析に最も重要な、最後の解釈。ぜひみなさんも参考にしてみてください。それでは、今回もご覧いただきありがとうございました!


この記事が気に入ったらサポートをしてみませんか?