射撃データいろいろ
久しぶりにnote書いてます。
最近、日ラのランキングにCSVファイルが公開されるようになりました。
これを使って色々データを作れるようになったので最近作った物を少し解説?します。
まずは、簡単なものです。Excelを使ってAPのランキングからスコアと、試合実施月を抽出し月ごとに箱ひげ図を作ってみました。AP男子とAP女子は区別しています。
これから分かることはまず、ランクリストが開催される12月から2月にかけてはばらつきが激しいことです。まあ予想できますね。あと、11月は比較的レベルが高いです。グレードの高い大会のみが集中していることが考えられます。
そして、気温差などの外的要因に起因する月ごとの特徴や違いはこのデータから見受けられませんでした。基本的に寒ければ当たらないはずですが、ランクリしかない時期なので、それが要因でグラフ上では低めに見えています。選手を絞って個人として月ごとに見ないと気温差などの外的要因が射撃に与える影響は測りかねます。個人差もあるし。
今日はあと一つだけ。GIS(地理情報システム)と融合させたデータです。
今回はライフル男子のランキングを使用し使ったデータは上位300名(年間で大会に3回以上出ている)のうち、所属都道府県が明らかな選手です。Excelで所属別にスコアをプロットしてQGISを用いて国土交通省の地図データを使用し、日本地図に融合、反映させ、描画してみました。
凡例の表示が残念ですが、まあいいでしょう。(上位が下になってる)
これ、県によって人数が違うのであまり参考に出来ないですが、色が濃いほど平均点が高いということです。やはり、人数による差が激しいです。特にトップの岡山県はデータ適用者が五輪代表選手一名のみのデータになってしまいました。
ですので、これ、ライフル男子だけでなく、全ての競技を反映させ、また全データを反映、そして人数や試合数に対して加重平均でプロットすれば面白いかなと思います。
まあとりあえずこんな感じです。今後はpythonを使って機械学習したいです。特にscattdb.comのデータを使ってみたいですが、まあいつになるか分かりませんがこの話はまた今度
この記事が気に入ったらサポートをしてみませんか?