vooau73291

質的比較法+社会システムモデリングで競馬予想

vooau73291

質的比較法+社会システムモデリングで競馬予想

マガジン

  • 質的比較分析法+社会システムモデリングで競馬予想

    海外の競馬研究機関から日本人の掛け金を守ることをミッションとして、競馬予想。『目的が曖昧、問いが悪い』でも『良いアウトカムができる手法』を研究する方法論主義者。『弊社には、スローガンは売るほどある。ほしいのはその実現手段』

  • データ分析の壁の穴

    データ分析の最大の壁、難点について解説します。質的変数、データの枯渇化と等々。順不同。

  • QAネットワーク

    現場の声なき声を、経営層に伝える方法論を、AI画像検査への高額投資を給料に廻してもらう方法を研究しています。

最近の記事

データ分析モデルは、2つ作るのがいい説

一つの分析モデルで、予測性能と解釈性能の両方を極めるのはムズイです。 そこで、『予測モデル』と『人が解釈するためのモデル』の2つを作ることをお薦めします。 『人が解釈するためのモデル』は、実験計画法等で、『予測モデル』をシミュレーション、データをリサンプリングすることで作ります。 2つに分けることで、お互いを気にせず、バリバリに、チューニングできます。 予測に使うのは『予測モデル』だけです。『解釈モデル』は『予測モデル』のデプロイを承認するだけです。 承認に使うは、今やって

    • AutoMLモデルのホワイトボックス化 介入効果の見える化

      2024/05/25 機械学習、深層学習モデルを、実験計画法を使って、ホワイトボックス化します。(だれかが、すでにやっているかな?) 正式な募集は、会社のホームページを作成中。 インパクト変数やSHAPと違い、クロス集計表で見える化するので判りやすいです。他の変数を停めた上で、注目変数の挙動を見る偏微分なんて、ムズくないですか? 停めた変数が左欄に列記され、 どの条件の下で打ち手の介入効果が出るのか? が、一目瞭然。 予測モデルに、解釈性を求めるのは無理があるかと思います

      • 交互作用最優先モデル を使った競馬予想 開発記録 3

        2024/05/20 AutoMLのお陰で、だれでもモデルが出せるようになった。しかし、現場のプロに説明すると、3次程度の交互作用は、そんなことは、すでに織り込み済と言われる。 現場のプロを驚かせるには、4次以上の交互作用の発見が必要。 以下の条件で、単独因子、交互作用の相関係数(クラメール)を求めてみた。味見なので値は低い。 結果、因子jの単因子が一位だが、2位に、jlnoの4因子、6位に、5因子のajlnoが並ぶ。 この4因子jlnoを、単独因子 j, l, n, oに

        • 質的比較分析+optunaで競馬予想 + TabNet

          質的比較分析+optunaで、3連複にて万馬券が出るレースを予想しているが、変数の数が46にもなると、さすがに、optuna探索も苦しい。4時間廻して、1925レース中10レースしかヒットしない。 そこで、TabNetにトライしたところ、驚きの結果がでた。 (実際に、馬券を購入するのに、許容できるリスクだった。) 連邦軍のTabNetとかいう新型の性能を見せてもらおうかな? 正確な射撃だ。それゆえ、予測しやすい。 目的:  次の土日のレースで、万馬券が出るレースを予想し、

        データ分析モデルは、2つ作るのがいい説

        マガジン

        • 質的比較分析法+社会システムモデリングで競馬予想
          11本
        • データ分析の壁の穴
          25本
        • QAネットワーク
          21本

        記事

          optunaのsuggestの機能アップ?過剰機能?

          optunaのsuggestには、以下の6つしかない。 suggest_categorical 数が多くなると、急激に遅くなるが、標準仕様? suggest_int suggest_uniform suggest_loguniform suggest_float suggest_discrete_uniform 主目的である機械、深層学習のハイパーパラメータの最適化には十分だが、optunaで制御等、ガチの最適化、誤った使い方?をすると、確率分布からのサンプリングがほしくな

          optunaのsuggestの機能アップ?過剰機能?

          競馬予想 競馬本の法則を質的比較分析する方法2

          『覚悟の競馬論』を読んだ。以下の仮説を、質的比較分析法で検証してみる。 仮説: 万馬券を当てるには、成績不振な調教師が、突然勝つ点を狙う。 成績優秀では、当ててもオッズが低い。 突然勝つ兆候を、どう察知するか? 今までと違う馬主さんで、その馬主さんの購入総額が高いこと、血統のいい馬が多いこと。 データ作りに時間が掛かりそう。

          競馬予想 競馬本の法則を質的比較分析する方法2

          競馬予想 競馬本の法則を質的比較分析する方法

          以下の競馬本にある法則を分析してみます。 『降格ローテ 激走の9割は順当である』 p087:6月以降の下級条件において3歳馬が強い これに、降格ローテ本として +前走が3才の限定戦              +前走が6着以下 尚、『』内は、2020年には気づかれているようで、プロの感の凄さには驚きです。 質的比較分析を、簡単に言うと、上記の条件で、該当、非該当(2値化)を作り、ピボットテーブルするだけです。2値化に割り切ることがポイントです。質的比較分析は、高価な機械学習ツ

          競馬予想 競馬本の法則を質的比較分析する方法

          競馬予想 各種法則の検証

          いろいろな手法でデータ分析をやっているが、所詮は、データ不足になる。 そこで、データが少なくても予想できる方法を勉強するため、競馬本を検証してみることにした。 尚、深層学習TabNetの成績がよく、本記事の努力が水の泡になりそう。 https://note.com/vooau73291/n/n2e649215aaba 以下の研究日記を、最初にまとめる。 1.競馬で儲けるには、みんなが外すレースで、自分だけ当てるしかない。 2.鉄板レースには、手を出さない。  (当てても

          競馬予想 各種法則の検証

          元素マッピングから拡散係数を求める

          ニーズがあるかな? この記事を読むと、失敗談、注意点が判り、GPU使用料、元素マッピング代等、数十万の研究費のムダが除けます。 最近は、微分方程式を深層学習で解くのが、オシャレみたい。          (ディープラーニング) 当初は、数値解法があるのに、なーぜ、なーぜと思ったが、 以下のメリットに驚いた。 1.点群データから、求めることができる。   メッシュ切りで悩むことがない。(メリットとしてデカい) 2.内挿計算が、高速   (DNNで、微分方程式の解を近似している

          元素マッピングから拡散係数を求める

          質的比較分析法+optunaで競馬予想Ⅲ

          以下で、事前検証をした。 この記事では、本題の競馬予想にトライしていく。 騎手、馬、調教師、馬主の数値化について 以前は、以下の順番で数値化したが、実績がない馬が勝つという場面が多い競馬では役に立たなかった。 そこで、次の土日に出る登場人物で2値化する。 A騎手か、notA騎手か? X馬か、notX馬か? これによって、探索範囲が狭くなる。次の土日に出ない騎手は探索しない。 狭くなるといっても、パソコン程度で探索できるのは、ほんの一部だが。 尚、事前検証の感覚だが、2値化

          質的比較分析法+optunaで競馬予想Ⅲ

          質的比較分析法+optunaで競馬予想Ⅱ

          新たに、以下の切り口で開発してみる。 1.無料の生成AIでは、質的比較分析を使っての競馬予想は厳しい。   (データ数=事例が多すぎる) 2.多値質的比較分析では、多値化を欲張ってしまい、計算が遅くなる。   カテゴリが多すぎて、計算できなくなる。 3.2値では、閾値が恣意的と怒られる。 4.2値の計算の速さは捨てがたいので、optunaを使い、2値化の閾値を最適化する。 2023/12/16 やっと、閾値最適化プログラムが出来た。教材は、 第6章 社会運動の発生——国際

          質的比較分析法+optunaで競馬予想Ⅱ

          生成AIで競馬予想 2 質的比較分析編

          競馬データのように、名義変数が多い場合のデータ分析法として、質的比較分析法があるが、生成AIで可能か?チャレンジしてみる。 (文系のためのデータ分析法) 以下の表で、論理式の生成が可能か? | 因子1 | 因子2 | 因子3 | アウトカム | |---|---|---|---| | 男 | 20代 | 高卒 | 0 | | 男 | 20代 | 大卒 | 1 | | 男 | 20代 | 大学院卒以上 | 1 | | 男 | 30代 | 高卒 | 0 | | 男 | 30代

          生成AIで競馬予想 2 質的比較分析編

          データの可視化(次元圧縮)で競馬予想

          次元圧縮PHATEの記事を読んだ。 面白そうなのに、日本語の記事が1本しか見つからない。 2019年12月の記事。 可視化(次元圧縮)を使う狙い: 1.高次の交互作用を活かし、AutoMLとは違う結果を出したい。   (AutoMLは、シンプルな要因効果を優先するので、むしろ、ビジネス現場のプロに、バカにされる。) 2.予測に機械学習など使わず、似ている過去データを機械学習で探して、類似データから、人間の感で予想すればいいじゃない?  (名義変数の数値化に悩むくらいなら)

          データの可視化(次元圧縮)で競馬予想

          生成AIで直交表

          まだ、無理か? 直交表で5因子4水準を作ることは、一般的にはできません。なぜなら、4水準を割り付けるには3列の直交表が必要で、5因子なら15列必要になるからです。しかし、一般的な直交表では、2のべき乗の列数しかありません。例えば、L16(2^15)は16列しかありません。? しかし、直交表の拡張方法を使えば、5因子4水準の実験計画を作ることが可能です。直交表の拡張方法とは、既存の直交表に新しい列を追加する方法です。? 例えば、L16(2^15)に1列を追加して、L16(2^

          生成AIで直交表

          生成AIで競馬予想 1

          びっくり。bardは、以下も可能なんだ。 テーブルデータのURL:https://example.com/table.csv 新しいデータ: 性別:男性 年齢:25歳 住所:東京都港区 類似度測定方法:コサイン 練習---------------------------------------------------------------- テーブルデータ: 性別 | 年齢 | 住所 ---|---|---| 男性 | 20歳 | 東京都港区 男性 | 25歳 | 東京都

          生成AIで競馬予想 1

          optunaによる自動ピボットテーブルで競馬予想 開発物語 1

          以下の切り口、考え方で、予想する。 1.前走2着が、次のレースに臨む調教メニューで、着順が決まるか?   (前走1着は、クラスが上がると勝てない。) 2.介入があるデータを相手にする。   何を改善して、次レースに臨んているか?   前走5着以下では、努力しないかも?単なる出走奨励金狙い。 3.高次の交互作用を無視しないため、ピボットテーブル分析を自動で行う。ピボットテーブルの切り口は膨大な組合せになるが、optunaで、探索が現実的になってきた。多次元分割表分析? (opt

          optunaによる自動ピボットテーブルで競馬予想 開発物語 1