老賭徒: 遲來的季後檢討

2018遲來的季後檢討

差不多有幾個月沒有更新，其間仍然不斷努力將模型修改，測試修改再修改，但主要factors數量未有太多增加，仍然維持在30個以下，真的不知道還需要什麼數據才能超過半百？馬季結束差不多有一個月了，就來一個簡單的總結吧！

· 上季為全季使用LR模型投注的季度，終於以「輸錢」結束，損失了大約10.7%總投注額，成績比亂買好一些，但只是一般未達預期。

· 上季以獨贏W為主、連贏Q為副的投注策略。多數輸錢在熱門場次，大部份是賠率沒有優勢下而不作投注，變相造成刻意求冷，或與熱門對賭的情況，老某相信這與「雷神」有莫大關係！當然計算不準確也是致命傷之一。

· 因子(Factor) 增加問題，發現有很多因子是統計有效，但實際是沒有預測能力，甚至是有相反效果。例如，一個顯著有效的因子，可以令一些因子(特別是只使用如0,1簡單數據的)在統計計算上有效，但作用是相反的。因子如「上賽是否入位」理應是上賽人位會越好一些，但模型卻指示反方向。在情況之下老某又怎可以採用這些有疑問的因子作計算，最後只好「刪」個痛快，因此因子數量不但沒有增加，反而減少了。

· 現時老某是將所有數據輸入LR軟件計算，不分類別、場次、班次、路程... 運算後系統自動給出結果，除了有效性，通常給出越大越好或越細越好的方向性，即是代表此因子有正或負面影響。老某發覺現時所輸入的數據資料可分為2個類別，一為與個別場次比較，如名次、走位。另一為與整體數據比較，如時間、負磅、評分等。

· 說到這裏，可能各位有點不明及混亂，老某只想表達有一些數據是要修正及改造才有真正效果，將數據盡量改造為同一類別。正如「名次」及「時間」，為何運算結果只有「名次」是有效而「時間」是無效或變成負面影響。這也解答了早前有Blog友向池兄提問，他的模型其中一個因子「累積獎金」對勝出預期竟然有負面影響，即越低越有機會勝出？沒可能吧！這與大眾想法相反。這可能大多數的勝出馬匹的累積獎金，並不如想像般在整體數據的高位，而是在一般低的位置，原因是中低班獎金賽事遠比高班為多。如將「累積獎金」在個別場次排名先後，結果可能是不一樣。

· 下季將加入操練及馬匹近況的因子，花了不少時間下載及整理三年操練記錄，用了大概20個因素，只組合到2個有效因子，與找金礦一樣困難。

以上純粹個人觀點。

期望下季有更好的成積，以現時情況來看，要戰勝馬會可能性極少，唯有將目標及範圍修改一下，以「興趣」為先，「贏錢」為次。

老賭徒

2018年8月8日星期三

遲來的季後檢討

4 則留言:

舉報濫用