2024年はどれぐらいWIN5の傾向を捉えることができたのか?
振り返りながら、的中率を上げるにはどうすればよいか、考えます
2023年の振り返りは、こちらから
このページの内容が聞くだけで分かる動画もあります
2024年の結果
2024年のWIN5統計は以下の通り
項目 | 記録 |
---|---|
WIN5発売回数 | 60回 (300レース) |
傾向合致率平均 | 68.8% |
統計推し馬 勝率 | 56.7% |
推し馬が5勝した回数 | 3回 |
消し馬が0勝だった回数 | 13回 |
2024年のウィークポイント
毎週反省会をやっている感覚としては、枠順/展開/血統といった、
このブログでは「コース傾向」と分類している項目に裏切られている感覚がありました
そこで、2024年に行われた300レースについて、各統計項目の合致率を見た結果は以下の通り
・評価
◎:買い条件/消し条件の双方が合致、または顕著に有利な傾向と合致
◯:買い条件/消し条件のいずれかが合致
△:参考レース実績で低確率の事象
✕:参考レース実績で未発生の事象
◎と◯の合計、つまり傾向に合致していた率で80%を超えるのが「騎手/厩舎」だけということで、
他の項目はテコ入れが必要かなというところ
改善方法の検討
では、どうするかの検討
結論としては、直近のコース実績から、”そのコース”が、どういったレース結果になりやすいか?
という点に着目するために、分析対象レースを変更します
このブログではこれまで、”そのレース”が、どういったレース結果になりやすいか?
という点に着目して、過去10年分の当該レースの結果を対象に分析してきました
しかし、
・競走に関するルールの変化
・競馬場の変化(改修工事や、馬場の改良など)
・馬の変化(種牡馬の入れ替わりや、育成の変化など)
・人の変化(騎手/厩舎の入れ替わりや、戦略/スキルの変化など)
等々、様々な要因の変化によって、
過去10年分の当該レースだけを参考にしているのが、適当ではないのでは?という仮説
具体的な変更点
2024年、京都競馬場の5回開催以降では、試験的に改善版の分析手法を取り入れていました
変更前:同番組の過去10年分
変更後:同コースの特別競走、直近5年分
※対象レースが少ないコースでは、平場を含む場合あり
ただし例外として、臨戦過程は番組編成に依って変わる要素のため、
引き続き同番組の過去10年分を対象に分析予定です
上記の参考レース結果を学習したモデルを作成し、
そのモデルで算出したコース傾向合致率を元に、統計推し馬/消し馬の判断を行います
なお学習するデータは引き続き、JRAがレース結果として発表するもののみです
コース傾向で当たるのか検証
上記の分析手法で1着馬を当てられるのか?
2023年までのレース結果を学習したモデルに、2024年のレースを予測させて検証しました
・2020年〜2023年のレース結果を学習
・主場は主に3勝クラス以上が対象
→レース数が少ないコースでは2勝クラスを含む場合あり
・ローカルは主に2勝クラス以上が対象
→レース数が少ないコースでは1勝クラスを含む場合あり
・コース傾向合致率トップの馬の勝率/単勝回収率を集計
・特定のレースでのみ特別競走が組まれるコースは省く
結果は以下の通り
阪神/芝/2200mのみ、2024年は施行数が1レースだけで、その1レースを外しているので0%
それ以外は得意/不得意はありながらも、単勝予測モデルとして、ちゃんと機能しそうですね
実際の運用に向けて
今回の検証では、2020年以降で、
少ないコースで30レース程度、多くて100レース程度のデータを学習させています
施行数の少ないコースでは、2019年以前までさらに遡ることも選択肢としてはあるのですが
それも検証してみた結果、コースによって差異はあるものの、概ね、
古すぎるデータを学習すると、予測精度が落ちる傾向でした
なので、学習データが減るとしても、2020年以降のデータでやっていきます
このあたりは、常に検証と調整の繰り返しかなと思います
直近のレース結果を追加学習しながら、データ範囲も、学習方法も、最適解を追い求めていきます
最後に、最も重要かつ難しい課題として、
馬体重やオッズ、レース展開(各馬の位置取り/上がりタイム順位)など、
レース時にならなければ数字が分からないものを、どれだけ正確に想定できるか、という点があります
これらの数字の想定方法は、昨年までと同様です
- 馬体重
- 前走馬体重を適用する
- 調教後馬体重が公表されるG1では、調教後馬体重を適用する
- オッズ
- netkeibaの予想オッズを適用する
※2024年の実績では、かなり高精度で予想されている - 前日発売がある重賞は、実際の前日オッズを適用する
- netkeibaの予想オッズを適用する
- 位置取り
- netkeibaのレース展開予想を元に、おおよそのグルーピングを行う
- グループ内の順位は、近走の位置取り/前半1F-3Fタイムを元に想定する
- 上がりタイム順位
- 近走の上がり1F-3Fタイムを元に想定する
これの項目も、もちろん実績ベース
すべてはデータに基づいて競馬と向き合います
2025年も、データで当てたい
ここまで説明してきた内容は、2025年1回目のWIN5から採用します
この方法が良いのか悪いのかも、ある程度の中長期で、回数を重ねないと判りません
なので、たぶん2025年はずっとこのスタイルで行きますが、
途中でマイナーチェンジがあれば、随時説明していきます
コメント