見出し画像

『孫社長にたたきこまれた すごい数値化仕事術』を読みながら、マイナースポーツ「パデル」の分析 Day6

毎週土日の勉強note、第6弾です。

先週まではこちら。

本はこちら。

今週は単回帰分析などを使ってみたかったのと、前週までのデータでは結論を出せないような集計方法な気がしたので、改めてデータを取り直してみました。

さて、データが出来上がったところで分析していこう!と思ったのですが、自分の作業環境であるiPad Pro×スプレッドシートでは表グラフが作れないという衝撃の事実。。。

近似曲線が作れるアプリを探してiOS用のExcelをダウンロードしましたが、無償版では表が作成できず。。。

作業環境を2012年くらいに購入したMacBook airに移します。

散布図と近似曲線を作っていきます。

元々の始まりは「安全なサービスリターンのコースを知りたい」だったので、散布図を作るにあたって「ラリーがたくさん続いたプレーと、サービスリターンの質に関係があるのでは?」という仮説で作っていっています。

▼x軸:返球のコース / y軸:ラリー回数

画像1

▼x軸:返球の高さ / y軸:ラリー回数

画像2

▼x軸:返球の速さ / y軸:ラリー回数

画像3

一応ここまでの作業を説明します。

・スプレッドシートにデータを集計
・x軸とy軸を決めて、挿入>グラフから散布図を選んで作成
・右側のカスタマイズ>系列からトレンドラインにチェックを入れて線を引く

という感じで、上記のグラフを作成しました。

ここで、書籍の内容に戻ると「近似曲線が適切か確認する」とあります。

R-2乗値を見ることで、現実に則したラインが引けているかわかるとのこと。
数値が1に近いほど現実に則しており、0.5以上であれば精度が高いと見ていいようです。

スプレッドシートの場合はカスタマイズ>系列のトレンドラインにチェックを入れたあとに、「決定係数を表示する」にチェックを入れることでグラフ上部に表示される様になります。

それぞれの決定係数が下記。

・x軸:返球のコース / y軸:ラリー回数の決定係数:R^2=0.191

・x軸:返球の高さ / y軸:ラリー回数:R^2=226

・x軸:返球の速さ / y軸:ラリー回数:R^2=174

……?

あれーーー0.5を超えないですね…。。。

うーん。

コースも1〜5に分割して出したものの、サーバーに返すのかサーバーでないプレイヤーに返すのかで、同じコースでも違う。

速ければいいってもんじゃないし、コートが狭い分コースが良いだけではなんとも言えない。

複数の要素が絡み合って決まることなので、単体の要素ではラリー数とは相関関係があるとは言えないようです。

次週はもう少しデータを眺めてみて、仮説の出し直しからやっていこうかと思います。

サポートお願いします!インタビュー記事制作費に使用させていただきます!