競馬予想

こんにちは、初めまして。New-Village と言います。

外資系IT企業でプリセールスのマネージャーをやっており、とあるドメインにおける統計を使った業務効率化、高度化のご提案をしています。仕事柄、お客様の業務分析や既存システムと新システムのFitGap、プロトタイプ作成の指示出しなどが中心となっており、分析の現場からは離れております。

分析やプログラミングが好きなんですが、触る機会も減っているので、コーディング欲の欲求不満を解消すべく趣味で分析システムを作ろうと思い立った次第です。

何を作るのか

プログラミングあるあるですが、プログラミングを覚えようと思うんだけどモチベーションが続かない、という話があります。簡単な話で、プログラミングを通じて何を実現すべきかが不明瞭だと、当然、マイルストン(いつまでに、何をやるのか)が不明瞭になって、日常の忙しさや疲れで後回しにされていってしまいます。

翻って、私の本プロジェクトにおける目的は何か?何をしたいのか?

競馬予想プログラムを作り、継続的な収益をあげて事業化する

これが私の目標です。結構難しい話です。ニュースでは、中国人が競馬の収益数億円を申告せずに帰国したとか、投資機関が日本の競馬で収益をあげているとか、報道されていますが、胴元が20%の収益をあげられる仕組みとなっているため、長期的に利益を上げ続けるのはかなり難しいと思っています。

最終的な目標点への到達率は微妙な話ですが、自分が十分にモチベートされる目標(目指して頑張ろうと思える話)であり、その過程で得られる効用は「プログラミング欲の欲求不満を解消する」ものであるので、ここに向けてプロジェクトを推進しようと思います。

具体的に何を用意するのか

さて、最終的な目標点が明確になったので、目標をブレイクダウンして、やるべき事、用意すべきことを明確化していきたいと思います。

1.データの用意
一回限りの分析であれば、適当にデータを集めればいいのですが、最終目標は「継続的に収益を上げる」ことなので、毎週行われる競馬のデータを継続的に収集、加工、蓄積する仕組みが必要となります。

過去にはクローラーを作って情報収集を試みたこともあるのですが、継続的な収集を行うためのクローラー、データ加工、スケジューラーの作成に多大な労力を割いてしまった経緯があるので、今回はお金で解決する方向性で考えています。

2.分析、統計モデルの作成
次に、集めたデータを使って傾向を分析し、統計モデルを作成する必要があります。これは、とりあえず経験を持っている、Python + scikit-learn + Jupyter で問題ないかと思っています。

ここについては、将来的にはディープラーニングを使っていきたいところですが、Pythonのディープラーニング・ライブラリを使ったことがないので、将来課題として、とりあえずはクイックかつ手堅い手法を採用していきます。

3.統計モデルの適用、運用
そして、作成した統計モデルに、毎週の競馬データを流し込んで予測結果を出力する仕組みです。また、モデルが有効に機能しているかどうか確認するためには、予測結果と実際の結果を比較して精度をモニタリングする必要があります。

実行部分は、上記2の内容に依存するので Pythonで進めることになります。結果を比較して可視化する部分については、とりあえず、サクッと動かせるFlask フレームワークを使っていこうと思います。

あまり経験はないですが、Angular、React、Vue あたりのJavascriptのフレームワークも気になっているので、将来的にはこちらに移行することも視野に入れています。

最後に

大きな方向性と、それを支える3つの方針について、忘れないようにまとめてみました。次回から上記3つの方針について、それぞれ掘り下げていければと思っています。


この記事が気に入ったらサポートをしてみませんか?