Proč Corsi není všechno. (A nikdy nebylo.)

3.8.2016 — by The Hockey Ninja0

main

Proč Corsi není všechno. (A nikdy nebylo.)

3.8.2016 — by The Hockey Ninja0

Sportovní analytika nestojí na jednom čísle.

Představte si, že používáte zákaznickou kartičku Tesca, a oni díky tomu zjistí, že dost nakupujete těstoviny. Jako fakt hodně. A protože pracují se statistikama, tak vám začnou posílat slevové kupóny na všechny ty farfalle, fusilli, casarece a další.

Na letácích postupně nenajdete nic jiného, jen pytlíky těstovin vystřídané občas nějakým tím XXL rodinným balením. Neuvěřitelně stereotypní karikatura Itala vás bude v letáku zvát na “Pasta days” na parkovišti před prodejnou. A protože vás bude víc takových, v místním Tescu dokonce zruší regály s oříškama a rejží a vrazí do nich další pytle kolínek.

Proč? Protože to přece VYŠLO Z ČÍSEL!!!

madness-smallbig

Nejsme čsfd, práce s daty je složitější

Ve skutečnosti je to obrovské nedorozumění a zásadní nepochopení, v čem vám může být práce s daty užitečná. Vaše láska k italské kuchyni je rozhodně zajímavá informace, ale nedá se s ní pracovat jako s jediným ultimátním číslem bez jakéhokoli kontextu. Koneckonců, většinou ty těstoviny nechroupáte suchý a samotný. A prakticky nikdo nechodí do obchodu jen kvůli nim.

Bohužel mám poslední dobou hodně blbý pocit, že spousta lidí vnímá užití statistiky ve sportu podobně černobíle. Pokud bojujete za využití analýz, tak si přece musíte myslet, že Corsi je všechno a každý nákup toaleťáku, který těstovinový nadšenec v Tescu udělá, je obrovskou prohrou čísel a důkazem, že teorie nikdy nepobere komplexní realitu života. No ne?

Nechci vypadat, že si osobně stěžuju. Mám se dobře, díky za optání. Jak asi víte, dostali jsme příležitost dělat úžasnou práci pro extraligový tým a získali spoustu zkušeností s fungováním hokejového klubu zevnitř. A Liberec není sám. Další kluby se přihlásily k myšlence využívání statistik pro analýzu hokeje (nejviditelněji třeba Vítkovice, příznivě se na ně dívá Chomutov a vím o pár dalších), pokročilé statistiky se dočkaly zmínky v nejrůznějších médiích a našeho nadšeneckého projektu sběru dat pro MS si dokonce všiml komentátor ČT a zmínil jej v přímém přenosu!

Myslel jsem ale, že to bude naopak. Nedoufal jsem v tak zajímavou práci, ale zato jsem (asi naivně) čekal, že za půldruhého roku bude myšlenka hokejové analytiky mnohem akceptovanější v mainstreamu. Že nebudeme počítat zmínky, protože jich bude hrozně moc. Že bude mít víc novinářů nebo komentátorů představu, o co jde a jak se dají analýzy využít. Ne nutně využívat a milovat, ale že prostě nebudou statistiky kontroverzní záležitostí, o níž panují “těstovinové” představy. Koneckonců, není to tak, že by celé hnutí vzniklo v Česku a celá debata neprobíhala dlouhé roky v NHL.

Zapomeňte na chvíli na čísla

antibigdata

Asi je chyba i na mé straně. Od začátku jsem se snažil prezentovat využití moderních statistik na příkladech a při tom prakticky není možné obejít statistiku střelecké převahy – Corsi. Logicky se spousta článků, ale i na ně navazujících rozhovorů točila kolem tohoto parametru. Jenže to, co se děje v baseballu, basketbalu, tenisu a se zpožděním v hokeji nebo fotbalu, není postavené na jednom dokonalém čísle, na jedné statistice. Dokonce ani není nejdůležitějším principem statistika!

Pokud si z celého Moneyballového hnutí máte odnést jednu věc, nemá to být Corsi ani jakýkoliv jiný parametr. Hlavním hrdinou je systematická a kritická práce s informacemi, jejich ověřování a rozhodování na jejich základě. Což by vám mělo znít povědomě, protože na stejných principech funguje jakákoliv věda. Myslíte si něco? Ok. A kde jsou důkazy?

“Hokej není věda, nerde!” Ano, výsledky budou vždycky nejvíc ovlivňovat sportovci, jejich přípravou a tréninkem ale týmy stráví tisícovku hodin. Hokej zcela určitě hrají lidé, takže se dá využít poznatků z psychologie, při stravování a trénování sportovců se můžeme opřít o zkušenosti medicíny a samozřejmě chceme systematicky sledovat a rozebírat dění na ledě. A tam se nabízí třeba statistické metody nebo systémové analýzy. Importované metody z jiných oborů s sebou nenesou jen zajímavé nápady, ale také možnosti kontroly.

Bez kontroly se nepohnete nikam

numbers

Protože vy nemůžete jen tak otrocky přebírat moudro z první bichle o osobním rozvoji, kterou sežene v Levných knihách. Součástí procesu je vracení se zpět, kontrola a ověřování! Jak si myslíte, že vzniklo Corsi? Nikdo si jej nevycucal z prstu a nevymyslel si k němu story, proč je to bezva věc. Na začátku někdo zkoumal výsledky spousty sezón v NHL a bral v potaz všechny dostupné ukazatele. Zjistilo se, že to nejsou hity, blokované střely ani buly, které předpovídají budoucí úspěchy. Nejlepší výsledky vykazovalo a stále vykazuje parametr, udávající jak přestřílíte soupeře v 5v5 (kterému někdo dal ten trochu nesmyslný název podle trenéra brankářů Jima Corsiho).

Tím ale práce nekončí. Podrobněji musíte rozebrat, jestli vůbec daná statistika dává nějaký smysl, jestli obsahuje informace nebo jde o náhodný statistický šum a jaký je poměr obou složek. V každém roce se můžete otočit zpět a podívat, jestli to dávalo smysl a jestli se nehoníte za něčím, co už v moderním hokeji nefunguje.

Čísla nikomu nekradou sport. Všechny analýzy pracují s realitou, v níž trenéři koučují, hráči trénují a právě rozborem těchto podmínek objevujeme opakující se vzorce úspěšných celků. Ne navždycky. Teď a tady! Pokud by se všichni hráči zbláznili a začali napalovat puky na bránu po přejetí modré, samozřejmě se tím změní situace a i smysluplnost statistik z nich vycházejících. Ale to se zatím nestalo a paradoxně jsou to právě analytici, kteří si pravděpodobně nejdřív všimnou, pokud nějaký tým třeba líp brání a nutí soupeře střílet z míň nebezpečných pozic.

Máš nápad? A Co z něj vyplývá?

smartdog_smallbig

Když chcete něco zkoumat, vědecké metody vás nutí konkretizovat nápady. Nemůžete dost dobře opakovat “Bez ranky není branky” a přitom si myslet, jaká je Corsi ptákovina, protože vlastně obojí mluví o tom samém. Zatímco když z Pavla Richtera v přímém přenosu vypadne to první, můžete se jen pousmát a brát to jako bonmot, střelecké statistiky můžete vzít a rozebírat do poslední karbonové třísky. Můžete v nich hledat souvislosti, rozebírat, jak se liší úspěšnost při vzdálenosti od branky, v čem jsou specifičtí jednotliví hráči, nebo si uvědomíte, že brankář má úplně jinou úspěšnost zákroků při normální hře a v oslabeních (tudíž by bylo fajn obě rozlišovat).

Nežijete přitom ve vzduchoprázdnu. Můžete navazovat na ostatní. Pokud Jakub Petr obdivuje hru Tampy Bay, dá se jejich hra rozsekat na malé části, vypíchnout její klíčové prvky a pomocí smysluplných statistik a videa srovnat na konci roku, jestli Vítkovice opravdu připomínaly “Lightnings” české extraligy. Můžete rozebrat, proč vyhráli Penguins celou NHL. Můžete se koukat do Švédska, Švýcarska nebo KHL a pracovat nejen se svými pocity a zkušenostmi, ale i ověřitelnými fakty, které vám naznačí, v čem je daný systém opravdu unikátní a jestli dává smysl jej převést do české extraligy. Můžete navazovat na to, co objevili ostatní. Rozvíjet nápady, zkoušet a zjišťovat, o kolik jste se sekli.

Hokejová analytika není teorií importovanou z abstraktního vesmíru. Obrovská spousta věcí vychází z ověřování věcí, které se v hokeji tradují roky. Ostatně i ty nejlepší nové nápady, ze kterých čerpáme, vznikají z diskusí s trenéry, skauty a/nebo ze sledování zápasů.

Neznamená to, že čísla budou mít vždycky pravdu. Stejně tak nemají vždycky pravdu trenéři při aplikaci nové strategie. Kreativita vždycky přichází se spoustou slepých uliček a nové věci často popírají zaužívané zásady. Sportovní zápasy jsou vlastně neustálým srovnáváním, která strategie funguje líp. Když ale umíte pracovat s informacemi a budete mít kvalitní nástroje, umožňující analyzovat, co se stalo, máte větší šanci dobrat se dřív lepšího výsledku. Týmy, které budou pravidelně dělat dobrá rozhodnutí, budou nahoře.

A v tom to celé je. Corsi tu je a poskytuje momentálně zajímavé informace, ale pokud jej zbožšťujete a myslíte, že je to všechno, děláte chyby. Změny probíhající ve světovém a částečně i českém sportu jsou mnohem hlubšího rázu. Nejde o jeden parametr nebo jeden obor, jde o efektivitu práce, sdílení informací a jejich reflexi. Tak, abyste se nenechali jednoduše utáhnout na vařené nudli. Nebo …ehm… osamocené statistice nudlí.

stats