2017年10月26日星期四

從賭馬再培訓的一天開始...《一》

老賭徒得池兄啟蒙,由什麼都無到現在的自動下注,全由一人包辦,差不多用了2年時間,現時成績只是一般。如再要提升準確度已感覺是十分困難,現時狀況只是「不輸」,未能達至「必贏」,更何來如顧教授般用程式賭馬致富(我的最終期望)。現借此地綜合一下經驗,提醒一下後來者,必須作出充份心理準備:

再一次說明,老賭徒本身能力及知識只是一般,與專家們的才學肯定有相當距離,在這發表的意見全是老賭徒個人經歷,正確與否需自行判斷。只是非常享受從冇到有的老感覺,才發表一下,如有不對,務必指正。

老賭徒不是讀數學出身,對統計學只有預科程度,花了不少時間學習基本功。加上不識編寫程式,需要時間學習基本程式編寫及Excel函數應用,如Excel VBAiMarcos等。

如對賭馬沒有興趣的你,更不應開始。如未能達至最終期望,你只得「雙失」,如只為了學術研究可另計。

老賭徒現時所建立的two step MLR模型,只有三十個有效因子,由一百多組數據選出來,沒有合成(可能有但唔知)和馬匹操練相關的因子。正如池兄所說,收集數據不困難,問題是怎樣將數據變成有效因子。

因先天不足,沒有馬匹操練及試閘表現的數據,只期望可以建立一個有獨特偏向的模型(是否覺得有點奇怪?),而不是追求與公衆倍率相乎的,就算有師兄認為公衆倍率已可能達至完全有效。因此有部分的因子希望可以做到有針對性。例如,同樣是有效因子,不用騎師勝率,會選擇「同程同場地騎師勝率」。

現時只收集了三季數據,約2千場次。因數據所限,所有場地(沙田、跑馬地及全天候)數據均「統一」計算,以增加統計的有效性。但經驗所得,經「統一」模型計算後,已確認為有效的因子(p<0.05),並不代表在個別場地分開計算時,同樣得到有效。甚至有個別因子可能完全相反方向,這引致不確定性出現。如有足夠數據,老賭徒會選擇獨立計算。

因上述的不確定性,會出現不同場地有不同的準確度。老賭徒現時的模型在沙田草地會發揮得比較好,跑馬地草地就最差。為解決這問題,會在計算馬匹機會率時,將在個別場地相對沒效的因子,輸入一個虛構(dummy數值(用平均值代替),而不是使用真實的數據計算,希望可以減少其影響性,但這方法現時未有足夠証明。
   
在開始初期,用Excel收集往績數據個人認為是最簡單而實用的,但到後期維護時,你會發現檔案太大及太慢了,並會嚴重影響工作效率,但如有額外資源,可考慮使用Database解決這情況。

收集數據必須要懂得編寫程式,如VBA,直接在馬會或相關賽馬網站下載往績,用程式整理數據,這才可以持續及事半功倍。Excel 函數應用也是非常重要,怎樣在超過三萬條記錄中尋找同馬匹上一次或平均的數據,或同場同程同... 記錄就要靠Excel 函數了,用VBA編程當然也可以,但剎雞豈用牛刀!

總括來說,對Excel + VBA + 統計軟件、如SPSS,SAS、的基本認識是必須的。老賭徒是用MiniTab去建立模型的。

個人認為建立一個合適而有優勢的模型是最困難的,要花大量時間及精力。老賭徒的經歷就是砌完又拆,拆完又砌,不斷重複、重複又重複,誇張一點可能到死也在修改中。在這階段完全沒有心得可言,只知道一個事實,就是你可能花一星期時間整理一個因子的數據,放入統計軟件運作後,結果可能是完全冇效,這時候的你會比死更難受。所以在任何天馬行空的想法前,必須慎重考慮。

記得池兄有個 blog(PP) ,曾經留言指出最後4百與最後2百加速變化是個極有用的因子,奈何要自已睇重播自行計時,相信PP兄肯定用了不少時間才有這樣的結論。由想法變成有效因子,真是要相當能力及決心,才可以去到這境界。

好了!有了計算機會率的MLR模型,無論好壞,均可操作,最壞的情況只是不如所願,沒有什麼大不了,可放膽試試。下會會分享一下投注分配系統、Kelly Criterion的應用實況,究竟位置(Pla)及位置連贏(PQ)是否可以使用Kelly分配注項?

待續。。。

沒有留言:

發佈留言