2019年9月17日星期二

看走得幾遠!


看走得幾遠!

2016-17年馬季開始,老某利用測試模型實戰投注獨贏及連贏彩池作回測試驗,其間不斷修改模型數據及因子,直到上季完結後結算,仍然是以「輸錢」結束。

在今年抖暑期間,以八年賽事數據再一次重造模型(過去是用4年數據),及加入以「贏錢」為基礎的回測,暫時回測結果是有利可圖的,但在實際操作可能有所不同。所以狠下決心今季將動用六位數字的預算作正式投注獨贏、連贏及三重彩,直至預算「破產」為止,看看可以走得幾遠!!

如再一次失敗,這該是「終結」時候了。

70 則留言:

  1. 個人覺得而家太多人識用模型來計算獨贏賠率,導致當有非常值博馬出現時全世界都賭,最後落飛到賠率比EO還要低,變相賭緊不值博馬。多人走的路冇著數,好明顯用REGRESSION計賠率的人數已經不再是小眾。

    回覆刪除
  2. 同意你的意見,買「著數」已經不再是優勢了。

    回覆刪除
  3. 請問老兄著數同優勢有何分別?

    回覆刪除
    回覆
    1. 著數同優勢在賭馬層面其實是一樣的,一個是廣東話比較貼地一些,廣東話有著數即是穩賺,這可能用詞不當,見諒見諒。
      其實老某的義思是指,在現時情況(最少我是相信的)確實很難找到投注優勢去戰勝馬會的抽水(17.5%),就算你的模型比一般大眾有10%優勢,但仍然要負7.5%,長遠下去只有輸錢收場,有回扣除外。

      刪除
    2. 你好, 老兄,
      多謝你之前給我的檔案. 省卻了我不少時間.

      近期見識過一位前輩, 叫上海王, 佢透露用9個FACTOR就可以砌一個可用模型, 有些FACTOR只要方向正確, 好容易顯著性<0.05, 但用左後命中率卻不升反跌, 這亦是池兄提過的有毒.....
      呢位上海王唔係吹水, 事後佢介紹了我測試->馬匹一生出賽次數這個FACTOR, 的確PASS左0.05水平, 但唔用後, 投注回收率同命中率反而提升了, 實在有趣.
      更堅的是他全晚只買一場, 結果由另外網友有POST出來, 証明上海王真係有料到....
      http://www.hkhorsedb.com/upload/files/uid_16728_SH_001.jpg
      小蝦米

      刪除
    3. 不用客氣,大家都是同道人。
      至於你說前輩的功力,我絕不懷疑,高人實在太多了,各施各法。老某都在其他討論區看到一個高人,用 9-10 factors 重疊法選馬法,贏錢與否只有他自已知。
      我認為有毒的Factor是一定存在的,這與數據有關,因為運算時只知勝負(1,0),但不知每場賽事的詳細內容,高低班次賽事比例不一,所以可能跑得越多越有機會勝出的情況,有師兄說要用 conditional LR比較合適。

      刪除
    4. 是什麼檔案呀? 可分享一下嗎?

      刪除
    5. Kelly Excel template, 如有興趣可以聯絡我。

      刪除
  4. 賭徒兄:
    請不要放棄啊! 看完你再培訓賽馬事業經歷. 好佩服你, 做得有紋有理, 又有落盤系統. 想像唔到你單人匹馬可以走得咁遠! Good Job!

    回覆刪除
    回覆
    1. 多謝支持!賭馬是老某的興趣,也是我的核心價值,過去、現在及將來都不變的,所以不會放棄的。正如我老豆一樣賭左50幾年,一樣繼續投注,只是注碼比過去不同。

      刪除
  5. 提一提各位師兄,18-19年匯入彩池已經接近15%總投注額,匯入的方法好似是開閘至十秒後,所以最後賠率是沒有人可以預計,有可能有賠率優勢的馬匹,跑完後沒有了,這因素不可不理。例如,6/10頭馬「跑得威」一直回飛至8.x,沒有綠燈下最後賠率是6.6,大家有沒有對策?

    回覆刪除
  6. 投資賽馬12/10/19 11:33

    賭徒兄, 請教一下...
    既然賭馬集團在開賽前一刻落15%總投注額, 而我地的計算跟他們差不多, 即大家命中率和賭率相同, 分別只是有無回一成佣.
    是否業餘都要增加投注額至1萬銀先有得長玩?!

    回覆刪除
    回覆
    1. 大家討論下,不敢言教。我個人認為是對,老某曾經考慮過以1萬以上,但計算總本金時,擔心在逆境時,心理壓力實在太大,在實在操作可能跟本不用太大資金。
      今日12/10 R2「乖勝追擊」一直回飛至8.x 但跑完只有5.9,即是說不要只買開跑前有edge的馬,本來冇但跑完後就有返,難賭!

      刪除
    2. 但相反的情況亦會同時存在, 變相讓成本減低.
      如果test的賠率是閘前0分鐘, 相信比拿馬會賽後的賠率更適合做train.

      小蝦米上

      刪除
    3. 小蝦米兄,當然有好有唔好,但會影響 2 Step model 的計算及 Kelly 分配注碼的準確性。所以今季老某投注策略有所調整,以模型機會率排名為基礎,混合Kelly一起投注,即就算冇Edge,但排名最前一樣投注。點解有這樣做法,一切源於BackTest結果。

      刪除
    4. 老兄,
      我想再講清楚些, 做BackTest計Edge, 最佳是用入閘時你投注的賠率計, 不是用跑完的賠率去計.
      系統能否盈利, 在於你用的方法能否行定通, 其中必須包容開跑後的賠率變化令Edge誤算在內, 用跑完的賠率去計, 當然完美, 但不切合現實
      小蝦米

      刪除
    5. 老兄,
      另外之前你給過我的FILE, 我發現你新馬用賠率推番個機會率算法有誤, 沒有減番馬會抽水出來, 如果一場全部新馬的話, 理論上你的機會率加總會是 1.20~1.22, 而不是1, 有空請查看一下, 再次謝謝你給我的檔案
      小蝦米上

      刪除
    6. 「做BackTest計Edge, 最佳是用入閘時你投注的賠率計」是用馬會最後賠率的,因沒有真實投注,所以沒有這賠率數據,明白是會有差異,老某的Backtest 主要用作選擇因子,及各model的相對情況及用作參考,沒有如小蝦米兄想得這麼仔細。
      「我發現你新馬用賠率推番個機會率算法有誤, 沒有減番馬會抽水出來」你的發現是正確的,老某唔做調整是希望在「試賭」時,投資額可以少一點,edge要cover到抽水才下注,這全因為對model沒有把握所至,實際上你可調整至1去計算注碼。

      刪除
    7. 當所有馬匹的機會率加總>1 , 在KELLY的效應下, 投注額不會少一點, 應相反是多了吧?
      小蝦米

      刪除
    8. 回蝦米兄,不會的。你試一下就知道。一般而言,Kelly只會建議投注EO prob > RO prob,因為如調整RO prob至1,RO prob 會變小,即更容易小於EO prob, Kelly 會建議下注。

      刪除
    9. 正如老兄所說,計EDGE係用真正賠率,唔使減番馬會抽水。只是如果你做2-step model,大部份人係會減番馬會抽水得出加埋等於1的概率。

      刪除
  7. 投資賽馬13/10/19 11:13

    "即是說不要只買開跑前有edge的馬,本來冇但跑完後就有返", 突然奇想, 可否預計大戶下注帶來新賠率預計? 假若啡綠格都係MLR預計得到, 又預計到大戶平均落xx%注碼, 必可預計一些"未浮上水面有潛質"賠率有無被間接變大. 只要長遠買佢地唔輸, 亦無所謂. 但一旦有被間接煲大賠率, 即估中當買中! 唔知咁諗得唔得? 即預計埋大戶下注時所產生的間接效應.

    回覆刪除
    回覆
    1. 師兄可能想得太複雜了。由外國匯入的投注額,未必全部是大戶的注碼。老某只是覺得,有不少的海外賭馬集團會選擇在海外投注(當然因為有著數及不想投注的馬匹暴光),經這些海外投注公司再匯入馬會,如是這樣,現場賠率走勢就有變化,特別是啡綠格的馬匹可能會比過去為少。

      刪除
  8. 老兄你的混合kelly係咪一part定額注碼,另一part係fractional kelly?
    甘kelly 個init capital 同定額注碼嘅本金大約係咩比例?
    會不會分開做賺蝕記錄?

    回覆刪除
    回覆
    1. 回索兄,你的理解是正確。定額與Kelly比例大約是2:1,看model準確度而定,定額會重一點,但要視乎Kelly計算edge有幾多,這方法是如果有edge又排名在前列者,會重注好多,相反冇edge但有排名,中了只可能微利或輸少一點。
      老某只做混合記錄,因從回測的數據顯示,老某的模型如只投注排名前3名,就有利可圖,當然回測買+ev一樣是正數,才有這樣混合Kelly的想法。

      刪除
    2. 雖然賭徒兄可能已經知道,但都講一下。做回測時,不可以用TRAIN過MODEL的賽事,唔係會有BIAS。最理想就係用2014以前賽季TRAIN,2015做回測,咁就最貼近實際操作。
      祝賭兄今季有所斬獲!

      刪除
    3. 多謝師兄提醒,分享一下老某的方法,不知道正確與否?老某在每次賽事會預留1-2場作回測,餘下場次做Train,這樣數據可以用到最近期,希望模型可以盡早反映實況。

      刪除
    4. 個人認為只要MODEL冇「出貓」,完全冇用TEST SET的任何資訊,就應該可以。

      刪除
  9. 我有record 1d 實時odds..
    有需要可以傾下。

    回覆刪除
    回覆
    1. 賠率的確是一個重要信息,老某模型只需要最後賠率即可,暫時不會考慮一日賠率走勢,無論如何,謝過師兄。

      刪除
  10. Blog主, 你好!

    為你打打氣,不要輕言放棄,享受過程亦很有興趣。

    另外,用MLR模型計,跑馬地的確好似比沙田難有盈利。我諗唔只你一個遇到瓶頸。

    有機會大家交流吓,共勉之!

    HG

    回覆刪除
    回覆
    1. 你的模型在沙田實戰已有盈利?
      HM

      刪除
    2. 多謝師兄的支持,師兄是同道人嗎?歡迎交流。確實跑馬地賽場的賽果比較波動,勝負距離短,場地意外多,騎師跑錯的機會高,有能力勝出的馬匹可能多次嘗試才有一次勝出,與沙田不同。

      刪除
    3. 今季實戰沙田是正數,但在跑馬地賽事是負數的。不同場地老某會用專用MLR算式計數,效果比以前好,但未能解決所有問題。

      刪除
    4. 既然正數, 為何要放棄? 只玩沙田就可以了

      有咩外國網站有介紹有用的因子?

      HM

      刪除
    5. HM兄,你誤會了,放棄只是不用這方法,不是賭馬。曾經回應過:「賭馬是老某的興趣,也是我的核心價值,過去、現在及將來都不變的,所以不會放棄的。正如我老豆一樣賭左50幾年,一樣繼續投注,只是注碼比過去不同。」有好多外國網站,如betfair,Punter 會找到一些因子insight
      https://www.punters.com.au/news/the-eight-most-important-analysis-factors_1309/

      刪除
  11. 想請教各位師兄,跑馬地最重要的勝出條件因素是什麼?可在這裡留言賜教。

    回覆刪除
    回覆
    1. 跑馬地檔位優勢比沙田明顯,但很難說甚麼是最重要。

      刪除
    2. 跑馬地檔位影響是明顯的,老某在跑馬地模型前五名因子重要性排序如下(只針對馬匹本身):
      往積前段位置>>同場整體完成時間>>勝負距離>>同場未段>>近況表現
      但在沙田是:
      同場未段>>近況表現>>勝負距離>>同場整體完成時間>>往積前段位置
      老某認為不同場地需求不同馬匹能力的,不同場地有不同算式這才比較合適。

      刪除
    3. 同場是指同場地?還是同場馬匹比較?
      往綪是所有往績?還是同場地?同賽程?
      HM

      刪除
    4. 同場是指沙田草地,沙田膠地及跑馬地草地。往績是二年內的加權成績。提醒一下,所有數據必須normalised後才有較好的使用性,所以與路程無關。

      刪除
    5. 老兄的模型結果,是否因為跑馬地步速偏慢,所以有利前置馬;而沙田步速偏快,對後上馬有利?小弟是賭馬初哥,剛看到一些馬評人提及步速,不知是否有關

      刪除
    6. 從老某的數據分析反而跑馬地賽事的步速一般比沙田快,短途賽事為主及加上場地細,直路短,所以對有前速的馬匹有利,而應該不是步速問題。就是因為場地這因素,容易引起意外,令同場未段的參考價值低於沙田,這是老某的想法。

      刪除
    7. 往積前段位置是所有賽事? 不論場地和路程?
      HM

      刪除
    8. 回HM兄,係沒有分場地及路程,老某試過分開計,效果不突出,可能分得太散令數據不多。

      刪除
  12. Have you tried to make a model for different tracks in HV & ST. Certain tracks favour certain running styles. Suggest to make models for each track. Then, for horses, you should have a database to know the horses are good in speed or stamina, make use of sectional times each horse made in its entire running life and then you master the horse abilities first, then predict the pace of the race (you need to try and try but worth it) and then next factor consider the conditions of the horse, read more books on horse training written by retired jockey and trainers. If you can master the potential pace of the race, each horse's abilities under the potential pace, predicted positions during the race and then how much its speed will decrease in last 400m, last 200m under the predicted pace, then the conditions of the horse...

    After you have done these hundred times, thousand times, I am sure you will get a feel on how the race will run. Some time you really need to close your eyes and imagine how the horses will be run in the race instead of just following your statistical model....handicapping is also an art more than science in some senses.

    回覆刪除
    回覆
    1. 想問一個關於步速的入門問題。人們話一場馬快步速,是指頭400米的時間較標準時間快嗎?還是最後400米之前的時間?
      有時見到騎師被問為何將一隻通常墮後的馬放前,他們答是練馬師指示就唔會有後果。咁其實係咪練馬師想隻馬點騎都得,尤其係之前成績一般的馬,佢地可以話想試下改變跑法睇下隻馬會唔會跑得好D?

      刪除
    2. 多謝PP兄的寶貴意見,你的方法老某曾經簡單地加入模型中,但不夠努力,成績有改善但未如理想:
      1)老某的模型是分開ST,HV及AWT,但不分路程。
      2)模型有步速的因素,但只有快,中,慢,以非最後400m的時間推算步速,對比老某自已製作的標淮時間。
      3)有參考及分析前段及最後未段400m的標淮Rating,但沒有如PP兄所說要了解最後200m的失速率(我叫的名稱),這因為不夠努力去自行計算,因馬會沒有提供。
      4)想問PP兄是用模型計機會率投注,或是以模型輔助選馬,計算評分後按序投注。
      5)老某完全同意handicapping is an art, 但真的想不明點解Bill及顧教授的statistical model可以這樣成功!現時老某統計模型只可以說是接近,但不可能贏錢的,所以已經慢慢轉向為輔助選馬系統。

      再一次多謝PP兄的意見!

      刪除
    3. 老某不是步速專家,賽事步速不會是指未段400m時間快慢,不過會有間接的關系,以老某統計所知,快步速一般會有一個較慢的未段時間,相反地慢步速會有較好的未段。
      放頭及留後是一樣可以勝出賽事,視乎對手,但馬匹是有自已的特性,如耐力及天生速度,是否有足夠膽量,喜歡隨後或跟前,才引至不同跑法。
      跑馬同田徑是一樣的,能在400m跑出低於20秒時間,牠一定是有能力的但未必是長勝者。

      刪除
  13. 小弟看到老兄的文章後,想請教一個入門問題,望不吝賜教。
    香港賽馬跑道分A,B,C等等,A跑道最闊,因為內欄移得最入。理論上A跑道的1號閘馬全程貼欄的話跑的路程較C跑道的1號閘馬短,所以時間應該會較快。但我看歷史數據,發現C跑道的馬做出的時間一般較A跑道的馬快,為甚麼呢?

    回覆刪除
    回覆
    1. 老某的數據跟你一樣,A跑道比C跑道一般要慢0.24,老某認為這不是距離問題,應該係步速問題引致。C跑道一般認為利放頭,步速會偏快,引至一個比較快的完成時間。所以只比較硬時間而不調整,是不會有好效果的。

      刪除
  14. 老兄,今日收獲如何?

    回覆刪除
    回覆
    1. 4/5賽日輸錢,今季暫時仍然還未破產。

      刪除
  15. 老兄,單T如何計算, 揀最值博的馬互穿, 定係買最值博的單T賠率.

    回覆刪除
    回覆
    1. 老某唔投注單T,只投注機會率排列最大的三重彩,像足球孖膽差不多,以少注博大。

      刪除
    2. 獨嬴,位置,連嬴這些也不買嗎?

      刪除
    3. 以計算獨贏賠率優勢為基礎投注連贏。不是以Kelly建議,說到底是老某的模型優勢不大所至。

      刪除
    4. 老兄還賺錢已經很強。

      刪除
    5. 澄清老某仍未贏錢,只是輸少左。會繼續努力的!

      刪除
    6. 請問老兄是只有一個計WIN的模型,以此為基礎,加上個人經驗投注其他彩池。還是每個彩池有一個獨立MODEL?

      刪除
    7. 是前者,用計獨贏的模作基礎加個人喜好投注。本來今季頭三月是跟Kelly建議投注,但效果差於預期,所以加入個人經驗投注。說到底,都是老某的模型優勢不足所至。

      刪除
    8. 老兄, 你仲有玩足球孖膽呀? 有冇同感有多寶時,派彩都越來越少?

      Terry

      刪除
  16. 機會率排列最大的三重彩, 係咪同獨贏反向, 獨贏搵最值博的賠率, 定係三重彩搵獨贏做基礎, 再排機會率,

    回覆刪除
    回覆
    1. 是以有賠率優勢作膽,然後排列選擇最佳的10,20或30,視乎個人投注能力。這只是一個方法,不一定會贏錢的。

      刪除
  17. 先生,你好
    同場末段,是比較同場馬匹avg,排序,還是比較標準時間較好呢

    回覆刪除
    回覆
    1. 如用logistic Regression,比較排序會好過時間。

      刪除
  18. HELLO
    我是初哥, 很高興看到老賭徒兄的BLOG,
    想問問如果以近績來衡量馬匹實力, 但如果是泥地馬怎樣處理
    好些馬跑泥地賽事之間有跑草地賽事
    1. 其實係將一匹馬成季賽績入電腦計, 還是抽泥地(比如同場同程)出來計 ?
    2. 如果是抽泥地賽績計, 是否又可以忽略近期在草地大敗 ?

    回覆刪除
  19. 首先你必須有一個標淮比較方法,如speed rating(對比賽事標淮時間)來統一表示馬匹表現,完成後便可評價每匹馬在上賽的表現,你可用上2-3賽的平均數值作為指標去比較馬匹近況。
    老某認為不同場地分開計數會比較合適,但如果你的speed rating 的系統足夠好及已經考慮所有場地,跑道及距離,你可以不用分開計算,只需計算場地、距離的合適性價可,希望這些可以幫到你。

    回覆刪除
    回覆
    1. 你的speed rating 是否全電腦計算? 不用人手調整?
      如何評估計算speed rating的方法好不好?

      刪除
    2. HM兄,你的問題證明是同道中人,老某沒有資源人手調整,只是盡力將相關數據用既定的原則作 normalized。評估方面,這是個非常重要的問題,但老某不知道怎樣評估方法的準確度。

      刪除