Jednym z ciekawszych zagadnień dotyczącym typów bukmacherskich jest strategia stawiania na remisy. Jest to o tyle ciekawe, iż przewidywania wyników najczęściej kojarzymy z wygraną czy przegraną danej drużyny. Według mnie, robimy to w głównej mierze podświadomie, chcąc tego. Nikt przecież nie oczekuje, że mecz będzie nudny.
Z reguły pod względem kursów bukmacherskich faworyzowany jest gospodarz co już wiemy z Przewaga własnego boiska – statystyki piłkarskie. Remisy natomiast zdarzają się stosunkowo rzadko, bo najczęściej w mniej niż 27% przypadkach. Oczywiście, jedne drużyny częściej remisują niż inne (co powinno dać już nam do myślenia!), jednak zastanawiające jest to od jakich zmiennych zależy ich występowanie. Można powiedzieć, że kolejny raz będziemy szukali znalezienia przepisu na wykrycie spotkań potencjalnie remisowych w zdarzeniach, które z pozoru wydają się zwykle losowe.

W tym przypadku również posłużymy się uczeniem maszynowym, które zaimplementujemy na, znanym już czytelnikom tej strony, zbiorze piłkarskich danych. Sam zbiór od ostatniego jego wykorzystania uległ zdecydowany tuningowi, gdyż pojawiło się w nim sporo nowych zmiennych, które docelowo mają ulepszyć model, a przynajmniej tak wydaje mi się jeszcze przed jego stworzeniu.

Do analizy, którą przedstawię poniżej przygotowywałem się dosyć długo, dlatego też statystyki piłkarskich odłożyłem na jakiś czas (choć nie na długo!).  Zainspirowany kilkoma artykułami dotyczącymi pewnych strategii obstawiania meczów piłkarskich postanowiłem sprawdzić co w tym temacie może dokonać uczenie maszynowe.  Po drodze spotkałem sporo przeciwności, o których zresztą przeczytacie  w jupytrze załączonym do tego posta. Uznaje ten post jako pierwszy w drodze do stworzenia genialnego modelu, co jest moim celem oczywiście ale zdaję sobie sprawę jak wiele trzeba poświecić czasu i energii aby to stworzyć. Poniższy kod, który przedstawiam jest przetarciem szlaków i zapoznanie się z naturą remisów w piłce nożnej z punktu widzenia analizy danych. Dlatego możecie traktować go na tę chwilę treningowo.. Idealnie byłoby gdybyście wymienili swoje uwagi i spostrzeżenia, które pozwolą ulepszyć predykcję.

Aby wszystkich zainteresowanych zachęcić do zabawy, zbiór danych oraz cały kod wykorzystany przy budowaniu modelu znajdziecie:
https://github.com/szydlinho/draws_strategy, a do przeglądania załączam poniżej stworzony do tego celu jupyter notebook.


Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.

view raw

Remisy.ipynb

hosted with ❤ by GitHub