ExtraligaKomentáře

6 důvodů, proč změnit Radegast index

17.3.2015 — by The Hockey Ninja9

main

ExtraligaKomentáře

6 důvodů, proč změnit Radegast index

17.3.2015 — by The Hockey Ninja9

Je dobře, že se liga snaží oživit hokejové statistiky novými parametry. Ale současná podoba Radegast indexu je prostě nesmyslná. Povím vám proč.

Na začátku byla chvályhodná snaha odměňovat hráče, kteří odvádějí důležitou a těžkou práci, neodrážející se v kanadském bodování. Není to chvályhodný tah, podporovat neviditelné hrdiny, stojící skromně v pozadí velkých týmových úspěchů? Statistika, s níž spojil své jméno hlavní pivovar českého hokeje, v současné podobě ale bohužel neměří nic užitečného a popírá všechny vědomosti, které jsme nasbírali v posledních 10 letech hokejové analytiky.

Radegast_index_logo2014

Poznámka na úvod:  Tento článek jsem měl rozepsaný už delší dobu, ale když to téma nedávno otevřel Jaroslav Krejčí na svém blogu, motivovalo mě to jej dokončit a rozvést některé argumenty.

Proč Radegast index nefunguje…

 

1. Spojuje tři nesouměřitelné parametry

Plus/minus body, hity a zblokované střely, z nichž se počítá Radegast index, jsou systémově na úplně jiné úrovni. Plus/minus udávají informaci o počtu gólů, kdy byl hráč na ledě a jsou tedy nejblíž smyslu hry. Vazba druhých dvou parametrů na důležité události, jako jsou góly a vítězství, je mnohem komplikovanější. Sčítat obojí dohromady se nekvalifikuje ani jako sčítání jablek s hruškami: spíš jablek s pneumatikami sadařova traktoru.

2. Proč se zrovna bloky počítají dvakrát?

Zblokování střely často bolí. Ale to není dostatečné zdůvodnění, proč by se zrovna tento parametr měl počítat do Radegast indexu dvakrát (pokud jste nevěděli, Radegast index = plus/minus body + hity + 2 × zblokované střely). V uplynulé základní části měl nejlepší hráč 104 hitů a nejlepší blokující hráč 101 bloků. Nemůžeme za tím tedy vidět snahu o lepší srovnání obou parametrů (oba dosahují podobných hodnot). Navíc, pokud bychom chtěli kalibrovat parametry tak, aby některý nepřevažoval ostatní, museli bychom začít u plus/minus bodů.

Přidržíme-li se totiž mé chatrné metafory, góly jsou jablka, která ovlivňují výsledek sklizně/zápasu. V Radegast indexu mají přitom naprosto paradoxně tu nejmenší roli (i nejlepší hráč v lize má pouze +25 bodů, v průměru ovlivňují Radegast index jen v řádu pár procent).

3. Plus minus body nemá smysl srovnávat napříč ligou

Když hrajete za Slavii, prohráváte. Když hrajete za Spartu, vyhráváte, a pokud v Holešovicích nespadnete už při přelízání mantinelu, budete získávat plusové body za účast na ledě při gólech. Vyvozovat něco ze srovnání hráčů z různě kvalitních týmů je zbytečné. I ti nejslabší z dobrých týmů na tom budou líp než nejlepší z celků na dně tabulky.

Na osobním Radegast indexu tato nespravedlnost není výrazněji vidět jen proto, že plus minus body vlastně jeho celkovou hodnotu ovlivňují minimálně. Ale pokud to dělají, tak preferují hráče z nejlepších týmů tabulky. V týmovém Radegast indexu je ale ovlivnění plus/minus body naprosto zjevné.

4. Překvapení: Počet hitů nijak nesouvisí s vítězstvími

Hity jsou super. Správně načasovaný úder dokáže zastrašit soupeře, nažhavit diváky a povzbudit tým k dovedení zápasu do vítězného konce…, říká teorie. Fakta ale ukazují něco úplně jiného. Konkrétně, že hity mají minimální souvislost s výhrou nebo prohrou v zápase. Nebo, že nejvíc příležitostí k hitům mají hráči, kteří prostě nemají puk.

Podle podrobné analýzy z NHL hity ani nesnižují počet střel soupeře na branku. Hity jsou zkrátka mimoběžnou aktivitou a není nijak dokázáno, že jejich vysoký počet nějak týmu pomáhá, jak naznačuje Radegast index.

5. Zblokované střely značí, že jste umožnili soupeři vystřelit

Zblokovat střelu je rozhodně lepší než nechat soupeře vystřelit. Tím ale výhody této statistiky končí. Z čísel v NHL dokonce vychází, že zblokované střely mají negativní korelaci s výhrami týmu. Ten, kdo nejčastěji musí blokovat střely, také nejčastěji prohrává. Proč? Protože ten, co vyhrál, strávil víc času v útoku.

Lepší než zblokovaná střela je totiž soupeře vůbec nepustit k nápřahu, nenechat jej usadit v pásmu nebo dokonce paralyzovat jeho nejlepší lajnu v jejím obranném pásmu. To jsou ale všechno informace, které Radegast index nesleduje.

6. Nerozlišuje oslabení ani přesilovky

Proč vlastně Radegast index intuitivně funguje (tj. ukazuje na hráče, kteří patří mezi tvrdší a obávané obránce)?

Mou hypotézou je, že za to můžou zejména oslabení, které zvyšují výskyt blokovaných střel zejména u obránců. Kdo se dlouhodobě pohybuje v těchto situacích, má největší šanci zblokovat střelu. Když si projdete nejlepší hráče z Radegast indexu, sedí to takřka bezchybně. Všichni patři mezi nejčastěji nasazované obránce svých týmů na oslabení. A všechny nejlepší hokejisty RI najdete také v žebříčku nejlepších blokujících hráčů.

Radegast index tedy pravděpodobně funguje jako sebenaplňující se proroctví. Trenéři posílají na led konkrétní hráče do složitých a nepřehledných situací a to ovlivňuje jejich statistiky. Zápas skončí a Radegast index s trochou statistického šumu zjistí, že tito hráči opravdu dokázali zblokovat víc střel než ostatní, kteří se v rizikových situacích vyskytovali méně. Je to trochu jako sledovat počet střel útočníků a nerozlišovat, že někteří chodí na přesilovky a jiní ne.

Bohužel tuto hypotézu nemůžeme jednoduše ověřit. Jedním z největších nedostatků sběru dat v extralize je nedostupnost členění všech základních statistik podle herních situací (shodný počet hráčů na ledě/oslabení/přesilovky).

Radegast index - váha jednotlivých parametrů
Radegast index je vlastně soutěží obránců o největší počet zblokovaných střel s prvkem náhody v podobě ostatních parametrů, a Ryana Hollwega

…a jak by to šlo napravit

Nechci tím ani v nejmenším říct, že vysoko postavení hráči v Radegast indexu jsou automaticky špatní. Každý, kdo sleduje například hru Jana Hanzlíka v Kometě, tuší, že je přínosem pro tým. Problém je, že tuhle hypotézu nemůže současný Radegast index potvrdit. K tomu potřebujeme jiné statistiky, třeba Radegast index 2.0.

Místo sčítání nespojitelného jen proto, že tato čísla máme tradičně k dispozici, bychom měli spíš sledovat parametry s přímým vztahem k vítězství. Dobrý bojovník, který nezáří v kanadském bodování, musí vynikat přece tím, že dokáže ubránit hvězdy soupeře. Měli bychom tedy sledovat, proti komu hráči nastupují a jak se jim proti nim daří.

To nezjistíme počtem hitů ani počtem bloků, ale ideálně počtem střel, které protivníkovi v rovnovážném stavu dovolí. Nebo ještě lépe rozdílem vlastních střeleckých pokusů v porovnání s běžným počtem střel soupeře. Víte, jak nejlíp otrávíte Jágra aspol.? Že ho vůbec nepustíte do tlaku v útočném pásmu. Pokud ho nepustíte pořádně do pásma, nebude co blokovat a v současném RI se to neprojeví.

Hokejista nasazovaný proti kvalitním hráčům soupeře, kterým pravidelně dovolí míň střel, než jsou zvyklí, má parametry kvalitního neviditelného bojovníka. A tuto schopnost je také možné vyjádřit číslem.

Můžeme k ní přidat i schopnost vyvarovat se faulů a naopak donucení protivníka k chybám. Můžeme pracovat i s rolí a úspěšnosti v oslabení, vztahovat analýzu k času na ledě. Výsledek může mít podobu abstraktního indexu, anebo může být Radegast index 2.0 vztažen přímo ke gólům, kterým bojovník pomohl zabránit. Získali bychom jasné číslo, reflektující hráčský přínos týmu. A to by bylo ve výsledku o dost atraktivnější a smysluplnější, nemyslíte?