見出し画像

データの共有と利用にむけて

 ご無沙汰しております。こちら久々の更新になります。

 これまでイタリアリーグのデータを使って日本との比較などしていましたが、このデータを自分だけ使っているのはもったいないので、共有できるようにしてみました。今回はその紹介になります。

Volleyball-data-room

 というわけで、GithubにVolleyball-data-roomというものを作りました。

画像1

 ここのリポジトリ“Italy”に作成したデータを置いています。下記URLよりアクセスしてもらえればと思います。

https://github.com/volleyballdataroom/Italy

 リポジトリの“Italy”を開くとこんな感じです。

画像2

 右のCodeのところからZipでダウンロードできます。

 用意したのは下の2つのCSV形式のファイルです。

・legavolley_femminile_gamelog.csv
・legavolley_gamelog.csv

 上が女子のでーたで、下が男子のデータになります。

 今のところ、2010/11シーズンから2018/19シーズンまでの試合ごとの記録(Game Log)になります。追々追加していく予定です。

 男女それぞれ、1部(Super Lega:A1)と2部(Serie A2:A2)のデータが入っています。変数Divisionで識別が可能です。

利用にあたって

 このデータは下記のURLで公開されているデータを集計したものです。

https://www.legavolley.it/
https://www.legavolleyfemminile.it/

 興味のある方はZipをダウンロードして利用していただければと思います。間違いが無いようには気を付けていますが、無いとはいえませんので、ご利用の際は自己責任でお願いします。また、改定が入る可能性もあります。

 利用に関してこちらから条件を付けるつもりはありませんが、このデータを売りつけるようなことや、悪用することのないようにお願いします。

Done is better than Perfect

 自分の使っているデータを他の人も使えるようにしました。

 大学生、もしくはアナリストのトレーニング向けに用意したつもりです。

 正直なところ、もっとGithubのことを勉強してからとも思ったのですが、データを利用できる環境の構築を優先しました。意識高い風にいえば「Done is better than Perfect(完璧を目指すよりまず終わらせろ)」でしょうか。

 要するに“見切り発車”というやつです。Githubを勉強していたら、いつまでたっても終わりそうにないので、できるところまで作った形です。

 というわけで、データの利用環境としてはまだまだなところがあります。その辺りは、ご意見をいただいて、徐々に改善していこうと思います。

 今回はこんなところで。

タイトル画像:いらすとや

この記事が気に入ったらサポートをしてみませんか?