2018年8月8日星期三

遲來的季後檢討


2018遲來的季後檢討

差不多有幾個月沒有更新,其間仍然不斷努力將模型修改,測試修改再修改,但主要factors數量未有太多增加,仍然維持在30個以下,真的不知道還需要什麼數據才能超過半百?馬季結束差不多有一個月了,就來一個簡單的總結吧!

·         上季為全季使用LR模型投注的季度,終於以「輸錢」結束,損失了大約10.7%總投注額,成績比亂買好一些,但只是一般未達預期。

·         上季以獨贏W為主、連贏Q為副的投注策略。多數輸錢在熱門場次,大部份是賠率沒有優勢下而不作投注,變相造成刻意求冷,或與熱門對賭的情況,老某相信這與「雷神」有莫大關係!當然計算不準確也是致命傷之一。

·         因子(Factor) 增加問題,發現有很多因子是統計有效,但實際是沒有預測能力,甚至是有相反效果。例如,一個顯著有效的因子,可以令一些因子(特別是只使用如0,1簡單數據的)在統計計算上有效,但作用是相反的。因子如「上賽是否入位」理應是上賽人位會越好一些,但模型卻指示反方向。在情況之下老某又怎可以採用這些有疑問的因子作計算,最後只好「刪」個痛快,因此因子數量不但沒有增加,反而減少了。

·         現時老某是將所有數據輸入LR軟件計算,不分類別、場次、班次、路程... 運算後系統自動給出結果,除了有效性,通常給出越大越好或越細越好的方向性,即是代表此因子有正或負面影響。老某發覺現時所輸入的數據資料可分為2個類別,一為與個別場次比較,如名次、走位。另一為與整體數據比較,如時間、負磅、評分等。

·         說到這裏,可能各位有點不明及混亂,老某只想表達有一些數據是要修正及改造才有真正效果,將數據盡量改造為同一類別。正如「名次」及「時間」,為何運算結果只有「名次」是有效而「時間」是無效或變成負面影響。這也解答了早前有Blog友向池兄提問,他的模型其中一個因子「累積獎金」對勝出預期竟然有負面影響,即越低越有機會勝出?沒可能吧!這與大眾想法相反。這可能大多數的勝出馬匹的累積獎金,並不如想像般在整體數據的高位,而是在一般低的位置,原因是中低班獎金賽事遠比高班為多。如將「累積獎金」在個別場次排名先後,結果可能是不一樣。

·         下季將加入操練及馬匹近況的因子,花了不少時間下載及整理三年操練記錄,用了大概20個因素,只組合到2個有效因子,與找金礦一樣困難。

以上純粹個人觀點。

期望下季有更好的成積,以現時情況來看,要戰勝馬會可能性極少,唯有將目標及範圍修改一下,以「興趣」為先,「贏錢」為次。

4 則留言:

  1. 你好 !原來除了池兄, 還有你這位大師研究

    想請問有啲parameter例如超榜, 用1/0代表. 這是否好的processing? 因為我發現最後這樣做法MLR全部都Insignificant....非常苦惱...

    回覆刪除
    回覆
    1. 超磅只是一個因素,單用這事件很難作為有效因子,建議將其他有相關因素,用1/0代表加起來,作為一個評分或用評分排序,可能有不同結果。

      刪除
  2. 獨嬴彩池來說, 政府稅額12.5%, 馬會抽佣5%, 你只損失了大約10.7%總投注額, 即fair game的話, 你已嬴6.8%了, 算係戰勝馬會及大眾了! 老兄繼續加油.

    回覆刪除