2019年1月17日星期四

死心不息



以今季實戰計算,老某現時的賽馬模型確有不少進步,準確度及可用性提高很多,賽前分析及賽後資料整理均可在30分鐘內達成,今季極有信心在獨贏投注方面達至「唔輸」的階段。現時只有三十個Factors左右,雖然近期積極尋找因子,但最後都是徙勞無功。花了不少力氣使新增的數據在統計上達有效,卻在使用另一組數據回測時毫無作用,可能模型已經到達階段性的瓶頸,需要較大外力才有突破,故此暫時放下。

放下了Factors的尋找,死心不息地將名次計算的資料(Ordering Probability)重讀多遍,看看有否突破?說實話,老某對每份論文都是一知半解,特別是算式及運算部份,老某跟本沒有能力解釋這類數學問題,嘗試的資格也沒有。還好!最終發現是老某自已計錯數,用錯了Independence Probability計算連贏(Q)及位置連贏(PQ) 的機會率 ,引致EO完全錯誤,造成熱門EO偏細,冷門EO偏大的趨勢,如一個模型大部份時間輸出「搏冷」指示,相信那有不輸的道理。

有了這重大「突破」,加上對用作推算23名的Discount Model了解深了,即全力修正程式,期望盡快再上征途,以下為(16/1/2019跑馬地)初次使用的成績:





當晚8場賽事中,只有R3R4 Kelly完全不建議投注,獨贏(W) 4/6、連贏(Q) 4/6、位置連贏(PQ) 5/6,當晚回報以連贏最佳,獨贏最差。

就是這麼簡單??? 所謂「路遙知馬力,要放長雙眼先得!

41 則留言:

  1. 老兄的堅持非常值得學習,至少賭㭉就做唔到XD
    Ordering Probability本身就唔易計,加上第二/三名的randomness 太大難以做modeling。
    所以好奇老兄係如何修正程式.

    回覆刪除
    回覆
    1. 老某是依據 Victor Lo(2008) 提出對 Henery model approximation 方法推算2-3名,準確性當然有偏差,不過可用性高,試下有冇突破。

      刪除
    2. 老兄好學不倦, 佩服佩服, 等我都研究一下先, 遲D要向老兄請教.

      刪除
    3. lordbritish17/7/19 17:23

      是依據 Victor Lo(2008)'s Henery model approximation ? 睇完但係睇唔到有乜數字可用, 當然啲formula就唔明喇... 我記得睇Benter講過係用0.81, 0.65...不過我試過都唔得, 唔係好準!!

      刪除
  2. 老兄最近的成績如何?

    回覆刪除
    回覆
    1. 近排成績一般,未有突破。老某對模型的狀況仍然沒有太大信心,感覺現時已去到一個重要十字路口,要繼續還是暫停反思一下方向。一人公司實在太吃力了,太多已知技術問題要解決,還有未知的。
      以老某業餘性質,堅持到今日,對自已已有交代。期望各師兄有所突破,戰勝大眾。

      刪除
    2. 老兄加油!
      我剛從賭場跳到馬場這領域,對統計模型一無所知,很多知識得從頭學起。
      望老兄多分享賜教,一起進步!

      刪除
  3. 多謝師兄的加油,遇到問題有時真的需要停一停、想一想、才會有動力更進一步。

    回覆刪除
  4. 想請問一個問題
    有沒有發現今年的馬特別難賭?

    回覆刪除
    回覆
    1. 其實冇話難唔難賭,只是模型計唔到優勢,這與模型本身質素有關。撇除模型計算,老某覺得今季的雷神,馬匹實力冇上兩季咁好,但賠率仍然偏熱,加上潘頓表現如時價海鮮,望兩望就收停。這兩因素已經足夠令一般馬迷感覺難賭。

      刪除
    2. 我反而覺得近兩次日馬,大熱門都太準,估唔到濕慢泥地都唔爆,對我黎講就真係難賭
      ,但開大熱的話,對大眾馬迷就係易賭喇喎。

      刪除
  5. 請問老兄最近有否用MODEL賭馬?成績如何?

    回覆刪除
  6. 當然有啦,個 model 開始成長中,得高人相助,更加了解電腦計馬的問題。如可以一個團隊式合作會好一點,一個人實在太辛苦了。

    回覆刪除
    回覆
    1. 老兄, 你想搵啲咩人合作? 點樣合作?

      刪除
  7. 老某是建議如你們有興趣開始,就應該組織一個團隊,包括IT/Programming用作收集數據及分析、賽馬專才如老某、數學專才用作解決統計問題,最後當然是金主啦。
    我現時最需是一個數學專才解決機會率的疑問。

    回覆刪除
    回覆
    1. 我只係一名IT9, 幫唔到你了

      刪除
  8. 都唔可以咁講,你已經成功了1/3。好似我咁唔識編程,只在網上抄VBA 用,花了不少時間收集,只收到4季資料,在這方面你已經優勝過我。我現時都開始找人幫我整套系統,由Excel 移植到 Database, 用 Excel 用到現階段實用不能再用,太慢了!

    回覆刪除
    回覆
    1. 我用緊SQL server 儲數據, 有10 幾季資料
      自動投注那一部份也寫好了
      但模型未弄好都係得物無所用

      刪除
  9. 老兄,請問你的model 有計算alpha 和 beta嗎?
    如有,可以透露相關數值嗎?

    回覆刪除
    回覆
    1. 老某現時個model alpha 係 0.84 beta 係 0.55 但老某覺得two step 唔會提高model的 hit rate, 只能將你的EO拉近至大眾而已,如你個model是準過大眾好多,根本不需要。我完全認同池兄所講它可以抵消一部份落飛效應。

      刪除
  10. 老兄是用過去三季的數據計算model的coefficient嗎?
    但是alpha的值很難提高。

    回覆刪除
  11. 對,不少於三季,大約3500場,alpha 提高與否看你的 factor效能。你是用什麼model, Logit, Probit...

    回覆刪除
    回覆
    1. alpha 同 Beta 其實是如何計出呢 ? 一直做model, 但沒有這個統計根底去了解這個......
      另外, 3500場.... 用來做train+test好像不太夠啊...

      小蝦米

      刪除
    2. 3500埸大約三季半資料,確實是唔夠,所以老某冇分開路程或埸地去做,主要原因是唔想用太舊的資料去做train, 加上老某只留半年資料做 backtest。
      Alpha 同 Beta 是指step two combine model 的 coefficient, alpha 指 EO model, beta 是 大眾 RO, 係Bill Benter 的論文有講。這是我的理解,可能有錯。

      刪除
    3. 哦, 謝謝. 若然如此, 反正我不是做2step model, 即可以不用理 alpha 同 beta了.
      羅文唱歌 : 變幻才是永恆 ..... 賽馬是流水作業式運作, 今季較新的資料亦是明季太舊的資料.
      我看過很多統計學教材, 他們教的傳統train + test方法, 未必適合用在賽馬上, 老賭徒兄要小心會不會這部分已出現了問題.
      小蝦米

      刪除
    4. 多謝提點,蝦米兄你用多少埸次做regression? 有冇分開場地及路程做?

      刪除
    5. 要分開場地路程....
      test = Season 1718 + 1819
      train = 試過用前一季至前七季逐個比較, 前五季準繩度最好.
      小蝦米

      刪除
    6. 明白了,因為excel問題暫時沒有儲存這麽多資料,要攪過database 先得。

      刪除
  12. 你個問題大部份人都面對過,努力雖然未必有回報,但這是唯一方法。你都完成整套系統只差一步,建議你重新看看Bill Benter 的論文,他是寫及講得最多的一位先驅人物,他寫的跟他做的很相似,老某深信最少在建立初期是這樣進行的

    回覆刪除
    回覆
    1. 謝謝...已看過Bill Benter的文章, 可能欠缺的就是老兄鑽研賽馬多年的心得, 始終未能找到足夠多的有效因子

      刪除
    2. 試下做paper所講的測試(table 1,2),了解一下自己model先,才計劃去向。

      刪除
    3. 已做了table 1, 2
      自己模型的R^2 跟公眾的差很遠 :(

      刪除
    4. 如果是這樣,應該改善因子的效率及數量。如你對賽馬唔熟,可以參考一下外國賽馬網站,會比香港更多資料的

      刪除
  13. 唔知自己有無計錯,最近幾年公眾R2 係0.2? 仲高過當年馬神0.17 !

    回覆刪除
    回覆
    1. 這個不奇怪,近年的公眾應該包括賭馬集團越來越準是正常的,高過馬神絕對是正確的,如用馬神當年的模型在現今搏殺輸錢是必然的,所以大家都要不斷進步才行,哈哈。

      刪除
    2. 發覺而家大戶買到隻馬無值搏率,迫其他MLR user去買其他馬,而令佢隻馬升返賠率,投注陷井

      刪除
    3. 投注陷阱是有這可能的,但話大熱門可以回飛而勝出的,這點老某有點不同意。
      所以老某近期都少買獨贏,特別是如大熱門沒有回飛下,又沒有落飛黨下注其他馬匹的情況下,老某一定放棄這埸獨贏投注,做少錯少。

      刪除
  14. 老兄,今季成績如何?

    回覆刪除
  15. 網誌管理員已經移除這則留言。

    回覆刪除
  16. 賽馬要正數, 千花百門, 不一定要值博率, 可以是提高強命中率,
    去補救 !! 於是, 有值博程式, 有求高命中率程式, 賽馬本質,
    就是這樣 ! 賽馬程式, 有時是可以像股票程式, 是時間式上升軌
    動態 ... ... 五花八門 !!

    回覆刪除
  17. 馬age 可以係邊download?

    回覆刪除