2021年11月20日星期六

誰是第二名


更新一下現況,老某仍然努力參與賽馬遊戲,雖然自家模型在上季仍然未贏,但今季開始對模型的信心不斷提升,經多年「相處」已經越來越清楚她的長短處,減少了人為干擾,盡力地以計算結果配合Kelly投注,期望成功一日到來,堅持中。

模型賭馬有着不凡的吸力,新來者不斷,完成MLR基本第一名計算後,就會問第二名怎樣處理?如不知誰會是第二名的機率,那就只能參與一遍紅海的獨贏Win投注。老某在這分享一下曾經使用的方法:

我想,如參考Bill Benter方法建立模型的,一定會使用Harville Model (包括Benter 修正、CX Wong或自行修正)估算第二及第三名的機率,一般以0.81 & 0.65為二及三名的修正常數,這個方法比較簡單但準確度老某覺得「麻麻」,這也可能是模型不準確所引發的因為太死板静態計算,沒有對環境改變作出相對的反應,如參賽馬多少是不在考慮之中,相信大家都同意多馬同少馬的埸合是有不同概率的覆蓋,所以老某用了一段時間就放棄了

老某介紹一個另類方法供大家參考,但不保証比上述的方法為佳,可視作多角度思考的一部份吧,方法好簡單,就是用Monte-carlo 模擬,這算是一個動態的估算。再者,不要被名稱嚇倒,操作是非常簡單的:

首先,不論是用Conditional LR或MLR計算,CLR會計算出一個分數,MLR會計算出一個概率,就是用分數或概率作為中間值運行模擬。

按統計指標定立一個分數波幅作誤差,假設中間值為10,設定誤差為正負5,即馬匹分數將由5至15間浮動。用Excel或其他軟件,生成一個0-1的隨機數相乘,就可以得出隨機的最終分數,然后重複模擬10萬次,這動作等於模擬同場馬匹競賽了10萬次的結果。次數隨你們喜歡,這還看電腦算力吧。

將隨機的分數與同場參賽馬匹的隨機分數比較,最高分的為第一名,次高的為第二,三高的……如此類推,最后統計馬匹第一名的總數,將總數除總模擬次數,結果便是勝出機會率了。二、三名的機會率也是相同方法得出,一次過模擬出參賽馬匹名次的機會率。自己動動手試下,這個方法有很大的擴展性.....想象無限,好運!





10 則留言:

  1. 終於攪掂條留言link回復正常。

    回覆刪除
  2. 這個Benter 修正 coefficient 不好找, stat 根底好的也不容易, 馬匹數量一變就唔同哂, CX Wong 的書中的 six dice game 已有啟示
    Monte-carlo的用法, 我在其他書中,或在程式交易前輩Yuen Cheng兄學的用法, 跟老兄的有很大差別, 不敢認同亦不敢否定, 找時間研究研究再找老兄請教...

    回覆刪除
    回覆
    1. 只要預計出馬匹該場次Speed Rating,假設馬匹表現是按Normal Distribution,這方法就可以簡易地找出名次的機會率。老某現時是使用這方法用Kelly投注二重彩及單T,已經差不多放棄了 Conditional Logistic Regression模型。都好客兄如有興趣可以一起研究。

      刪除
  3. 希望對你有用
    https://www.youtube.com/watch?v=eNjrrTKUKCk

    回覆刪除
    回覆
    1. 謝謝!你個名好正,同老某一樣想法。

      刪除
    2. 請繼續努力
      https://towardsdatascience.com/use-machine-learning-to-predict-horse-racing-4f1111fb6ced

      刪除
    3. 首先謝過師兄,老某真到退休年齡,學習及理解能力下降,如有興趣可電郵交流合作一下。

      刪除
    4. 此留言已被作者移除。

      刪除
    5. 其實我都唔識,不過見到師兄你停曬咁,明明有能力去做,而我想做都做唔到,覺得有啲可惜。
      所以提供另外一個方向,睇下得唔得,順帶一提,youtube嗰度有篇論文,你可以睇下,應該有幫助(哈哈!!雖然我睇唔明,就算用google翻譯)
      當然有興趣同師兄交流,你簡介嘅想法同我不謀而合,不過先至聲明,我數學同英文都係小學水平,如果你唔介意的話。

      刪除
    6. 可以呀,在老某的簡介中有聯絡電郵。

      刪除