Predykcja – strategia na remisy – wstęp – Analiza danych w piłce nożnej

Jednym z ciekawszych zagadnień dotyczącym typów bukmacherskich jest strategia stawiania na remisy. Jest to o tyle ciekawe, iż przewidywania wyników najczęściej kojarzymy z wygraną czy przegraną danej drużyny. Według mnie, robimy to w głównej mierze podświadomie, chcąc tego. Nikt przecież nie oczekuje, że mecz będzie nudny.
Z reguły pod względem kursów bukmacherskich faworyzowany jest gospodarz co już wiemy z Przewaga własnego boiska – statystyki piłkarskie. Remisy natomiast zdarzają się stosunkowo rzadko, bo najczęściej w mniej niż 27% przypadkach. Oczywiście, jedne drużyny częściej remisują niż inne (co powinno dać już nam do myślenia!), jednak zastanawiające jest to od jakich zmiennych zależy ich występowanie. Można powiedzieć, że kolejny raz będziemy szukali znalezienia przepisu na wykrycie spotkań potencjalnie remisowych w zdarzeniach, które z pozoru wydają się zwykle losowe.

W tym przypadku również posłużymy się uczeniem maszynowym, które zaimplementujemy na, znanym już czytelnikom tej strony, zbiorze piłkarskich danych. Sam zbiór od ostatniego jego wykorzystania uległ zdecydowany tuningowi, gdyż pojawiło się w nim sporo nowych zmiennych, które docelowo mają ulepszyć model, a przynajmniej tak wydaje mi się jeszcze przed jego stworzeniu.

Do analizy, którą przedstawię poniżej przygotowywałem się dosyć długo, dlatego też statystyki piłkarskich odłożyłem na jakiś czas (choć nie na długo!). Zainspirowany kilkoma artykułami dotyczącymi pewnych strategii obstawiania meczów piłkarskich postanowiłem sprawdzić co w tym temacie może dokonać uczenie maszynowe. Po drodze spotkałem sporo przeciwności, o których zresztą przeczytacie w jupytrze załączonym do tego posta. Uznaje ten post jako pierwszy w drodze do stworzenia genialnego modelu, co jest moim celem oczywiście ale zdaję sobie sprawę jak wiele trzeba poświecić czasu i energii aby to stworzyć. Poniższy kod, który przedstawiam jest przetarciem szlaków i zapoznanie się z naturą remisów w piłce nożnej z punktu widzenia analizy danych. Dlatego możecie traktować go na tę chwilę treningowo.. Idealnie byłoby gdybyście wymienili swoje uwagi i spostrzeżenia, które pozwolą ulepszyć predykcję.

Aby wszystkich zainteresowanych zachęcić do zabawy, zbiór danych oraz cały kod wykorzystany przy budowaniu modelu znajdziecie:
https://github.com/szydlinho/draws_strategy, a do przeglądania załączam poniżej stworzony do tego celu jupyter notebook.

Sorry, something went wrong. Reload?

Sorry, we cannot display this file.

Sorry, this file is invalid so it cannot be displayed.

<br /> Viewer requires iframe.<br />

view raw

Remisy.ipynb

hosted with ❤ by GitHub

2 myśli w temacie “Predykcja – strategia na remisy – wstęp”

Dodaj komentarz

adam81 (@adam19810112) pisze:

13 Maj, 2019 o 9:26 pm

Nie powinieneś wywalić z finalnego modelu HT_Draws_by_MW i HM1_W? Mają P > 0,05.
Co to jest Total_Diff? Pisałem magisterkę o doborze zmiennych, co prawda do liniowych modeli, ale wydaje mi się że jednokrotne użycie p jest słabą metodą. Ciekawe co wyjdzie jak dobierzesz je używając AIC lub BIC (te u mnie najlepiej się sprawdzały). Wiem, że to trzeba wygenerować wszystkie możliwe modele, ale może i tu dałoby lepsze wyniki.
Chętnie zobaczyłbym model i dokładność dla Ligue1.

PolubieniePolubienie

Odpowiedz
1. Paweł Szydlik pisze:
  
  13 Maj, 2019 o 9:44 pm
  
  Tak, masz rację – powininem. I będę to robił przy najbliższej aktualizacji skryptu. Miary AIC oraz BIC oczywiście też będą wykorzystywane i sprawdzimy jak wtedy wypadnie model najlpszy według tych statystyk. Jak sam widzisz, temat jest dosyć skomplikowany a ja sam będę nad nim pracował dość długo, dlatego dzięki wielkie za komentarz, to zdecydowanie ułatwia komunikację i pracę.
  Co do ligi francuskiej jesteś już kolejną osobą, która o tym wspomina więc chyba należy się w końcu przychylić do tej prośby 🙂
  Działamy i pracujemy, dzięki jeszcze raz za słowa uwagi i pozdrawiam!
  
  PolubieniePolubienie
  
  Odpowiedz

Dodaj komentarz Anuluj pisanie odpowiedzi

Ta witryna wykorzystuje usługę Akismet aby zredukować ilość spamu. Dowiedz się w jaki sposób dane w twoich komentarzach są przetwarzane.

Udostępnij:

Powiązane

2 myśli w temacie “Predykcja – strategia na remisy – wstęp”

Dodaj komentarz Anuluj pisanie odpowiedzi