『孫社長にたたきこまれた すごい数値化仕事術』を読みながら、マイナースポーツ「パデル」の分析 Day6
毎週土日の勉強note、第6弾です。
先週まではこちら。
本はこちら。
今週は単回帰分析などを使ってみたかったのと、前週までのデータでは結論を出せないような集計方法な気がしたので、改めてデータを取り直してみました。
さて、データが出来上がったところで分析していこう!と思ったのですが、自分の作業環境であるiPad Pro×スプレッドシートでは表グラフが作れないという衝撃の事実。。。
近似曲線が作れるアプリを探してiOS用のExcelをダウンロードしましたが、無償版では表が作成できず。。。
作業環境を2012年くらいに購入したMacBook airに移します。
散布図と近似曲線を作っていきます。
元々の始まりは「安全なサービスリターンのコースを知りたい」だったので、散布図を作るにあたって「ラリーがたくさん続いたプレーと、サービスリターンの質に関係があるのでは?」という仮説で作っていっています。
▼x軸:返球のコース / y軸:ラリー回数
▼x軸:返球の高さ / y軸:ラリー回数
▼x軸:返球の速さ / y軸:ラリー回数
一応ここまでの作業を説明します。
・スプレッドシートにデータを集計
・x軸とy軸を決めて、挿入>グラフから散布図を選んで作成
・右側のカスタマイズ>系列からトレンドラインにチェックを入れて線を引く
という感じで、上記のグラフを作成しました。
ここで、書籍の内容に戻ると「近似曲線が適切か確認する」とあります。
R-2乗値を見ることで、現実に則したラインが引けているかわかるとのこと。
数値が1に近いほど現実に則しており、0.5以上であれば精度が高いと見ていいようです。
スプレッドシートの場合はカスタマイズ>系列のトレンドラインにチェックを入れたあとに、「決定係数を表示する」にチェックを入れることでグラフ上部に表示される様になります。
それぞれの決定係数が下記。
・x軸:返球のコース / y軸:ラリー回数の決定係数:R^2=0.191
・x軸:返球の高さ / y軸:ラリー回数:R^2=226
・x軸:返球の速さ / y軸:ラリー回数:R^2=174
……?
あれーーー0.5を超えないですね…。。。
うーん。
コースも1〜5に分割して出したものの、サーバーに返すのかサーバーでないプレイヤーに返すのかで、同じコースでも違う。
速ければいいってもんじゃないし、コートが狭い分コースが良いだけではなんとも言えない。
複数の要素が絡み合って決まることなので、単体の要素ではラリー数とは相関関係があるとは言えないようです。
次週はもう少しデータを眺めてみて、仮説の出し直しからやっていこうかと思います。
サポートお願いします!インタビュー記事制作費に使用させていただきます!