main

Extraliga

PDOmetr: První čtvrtina extraligy nebyla úplně normální

20.10.2016 — by The Hockey Ninja0

První čtvrtina hokejové extraligy je za námi a to je vždy fajn příležitost na chvilku se zastavit a podívat se, co přinesla. Sestavil jsem proto jednoduchý graf, který stejně jako loni přináší základní informace o výkonnosti jednotlivých týmů a zasazuje je do víceletého kontextu. Vzhledem ke své potenciální závislosti se zdržím obšírných komentářů, ale jste šikovní, spoustu věcí si domyslíte sami.:) Představuji vám PDOmetr pro sezónu 2016/17.

EnglishNezařazené

Advanced stats: Hlinka Memorial Cup 2016

30.8.2016 — by The Hockey Ninja0

28970697695_35125be79b_k-960x641.jpg

Unique data for all the players and teams from the tournament

Just like many others in data analytics, I’ve made it no secret that I’m not too fond of the official IIHF game sheets. They might have made sense back when we still thought that hockey was about the survival of the toughest, but in this day and age, we need more. More data, more information about the players and the general flow of the game. Unfortunately, the IIHF doesn’t seem too eager to track these numbers, so we have to do it ourselves.

Earlier this year, me and my amazing team of volunteers had done just that for the IIHF Worlds, and since Hlinka Memorial Cup is one of the most important international tournaments for many draft prospects (U18), we decided to once again spend the better part of a week watching and re-watching the matches and gathering data.

What kind of stats will you find here?

  • Corsi For and Against 5v5
  • Scoring Chances For and Against 5v5
  • Goal For and Against 5v5
  • Individual Corsi Contribution (both in absolutes and %)
  • SV%/Sh%-on-ice, PDO-on-ice (counted with Corsi events)
  • data available for all players and teams

General disclaimer:

1. All the data is unofficial, obviously.
2. As always, short tournaments have the usual “small sample” issues. Still, it’s better to have some reliable information than outcome bias based just on the end results.

[Insert Juiciest Facts to Lure the Nerds in]

  • Despite finishing 5th, Canada showed strong possession games with CF% 64.2. The numbers suggest that they’ve got some trouble getting the shots from most dangerous areas, though.
  • Best 5v5 possession teams: Canada (64.2%), USA (58.0 %),
  • Most fun team (most Corsi events): CZE (98.6 events per game)
  • Most effective team: USA (44.4 % of all 5v5 shots from home-plate area)

ang

Numbers for Some Hot Prospects of 2017 & 2018 Draft Classes

Filip Zadina (2018, CZE): 43.4 CF% (+0.1 over team average), 42% ICP (he took 42% of all the CZ shots when he was on ice), 12 of his 22 shots were from homeplate area

Timothy Liljegren (2017, SWE): 50.3 CF% (+1.0), 15 shot attempts, 2 from homeplate Unfortunately, we didn’t have the time to track stats covering the defensemen’s job (zone exits etc.) too closely.

Michael Pastujov (2017, USA): strong performance based on possession numbers, 68.6 CF% (+10.6), scoring chance differential +55/-19 (74.3%)

Maxime Comtois (2017, CAN): 55.7 CF% (-8.5), 8 of 16 his shots were from homeplate area

Andrei Svechnikov (2018, RUS): 55.4 CF% (+6.2), 41 % of RUS shots (19 in total) were by him when he was on ice

But those are just individual numbers. Take a closer look at the charts to find the proper context with regards to the team performance. All stats are in embedded Tableau charts and you can feel free to use them (appropriately crediting the source). If you need more information, please contact me.

CHARTS (open in new window)

Credits:

I’d like to give a big shout out all the volunteers who make this project possible!

Namely: Tomáš Ptáček, Matěj Votrubec, Stanislav Pokorný, Michaela Kovářová, Petr Ciesarik, Martin Lukovics, Jaroslav Vondrák, Tomáš Horák, Jakub Špirk, Lukáš Joppa. Díky!

Cover photo: Juniorský hokej

Thanks to: Micah Blake McCurdy, who think up dull/fun categories for the charts (if I remember correctly)

English

Corsi Data from the IIHF World’s 2016

11.5.2016 — by The Hockey Ninja1

It’s 2016 and #fancystats should definitely not be a new term in the hockey world. Nhl.com and Liiga have adopted Corsi some time ago, with others vowing to follow in their path. However, it looks like the International Ice Hockey Federation (IIHF) unfortunately still prefers to stay in the safe (and boring) zone, reporting only on goals, shots and plus-minus statistics. We could either join in and pretend that adding some bar charts to the official World Championship website makes it modern and up-to-date… or we could choose to live in reality.

So, rather than patiently waiting for the IIHF to evolve, I decided to take matters into my own hands and track some of the advanced statistics myself. Well, not really by myself. I gathered a team of about 20 volunteers and we’re collecting data for nearly every important game of the championship. Our main focus are Corsi, scoring chances and shot (zone) locations, plus some additional stats (zone exits / entries, turnovers) for the Czech team.

All data will be published on this website using the Tableau platform and you are free to use them (appropriately crediting the source, obviously).

If you need more information, please contact me. In any case, tuck in, play around with the charts, and enjoy:)

Chart: Individual Corsi stats

Direct link to Tableau

Tracked teams: Canada, USA, Finland, Sweden, Czech Republic, Russia, Slovakia, Switzerland

People tracking the data

Corsi Executive Officer: The Hockey Ninja (twitter, FB)

Team Members: kesid, Jaroslav Vondrák, Robert Wünsch, Lukáš Joppa, Pavel Přidal, Martin Lukovics, Petr Malina (FB/web), Jaroslav Chmelař, Tomáš Ptáček „Vogel“, Tomáš Břečka, Martin Uvíra, Jarda Balaštík, Petr Kalenda (FB/email), Michal Kulveit, Stanislav Pokorný, Michaela Kovářová, Filip Brauner (FB)

MS 2015MS 2016

Pomozte udělat mistrovství zábavnější pro všechny!

28.4.2016 — by The Hockey Ninja0

usa-49909_640.jpg

Hledají se dobrovolníci pro sběr pokročilých statistik

Mistrovství světa startuje za pár dní a i letos by byla škoda spolehnout se jen na základní, oficiálně sbírané statistiky. Opět s pomocí @kesid89 plánujeme ukázat, že svět hokejových čísel může mít mnohem větší rozlišení a hloubku. Loni z nich vyšlo pár pěkných čísel, které možná ukázaly hru českého nároďáku v trochu jiném světle než ve standardních médiích (velkou analýzu si můžete přečíst zde).

KomentářeNHL

Dojmy ze statistické konference Floridy Panthers

22.2.2016 — by The Hockey Ninja0

IMG_0445-960x717.jpg

Neptej se PROČ, ptej se JAK je možné využít nových dat v hokeji

Vydat se v zimě na Floridu je jako cestovat časem. Ze zablácené české reality se totiž ocitnete v příjemně prosluněném prostředí s dvacetistupňovými teplotami a typickou slaností vzduchu, signalizující blízkost nějaké té větší louže než je Mácháč. Tohle že je únor?! Beru!

IMG_0432
Když nemůžete spát kvůli časovému posunu, můžete se na Floridě živit jako fotograf kýčovitých snímků.

Cestoval bych ale i někam, kde se nedají pořídit takovýhle fotky, pokud by se zde odehrávalo akce jako na Floridě. Místní Panthers totiž jako první klub NHL zorganizovali konferenci/workshop o analytice ve sportu #PAWS 16 (Panthers Analytics Workshop). Tedy o všech pokročilých a moderních statistikách a jejich potenciálnímu využití ve sportovních klubech, v médiích anebo třeba v ekonomických rozvahách NHL.

Jak se potvrdilo, situace za Atlantikem je výrazně odlišná od toho, co se děje v Evropě, speciálně v Česku.

Dojem první: Dveře jsou otevřené­­­­­­

Zatímco v Extralize se podle veřejných informací pouští do objevování světa pokročilých statistik několik málo klubů (nejvýrazněji se k tomu přihlásil Liberec), v NHL jsou už tyto analýzy součástí běžné debaty. Na workshopu se k nim vyjadřovali skauti, asistent trenéra Panthers i televizní moderátoři a hlasatelé. Neznamená to, že by si všichni nadšeně dodělali doktorát ze statistiky a na místě si vyměňovali matematické vtípky. Každý z nich ale ví o existenci nových statistik či metod a přemýšlí, jestli a jak je může využít při své práci.

Přitom Florida Panthers nepatří mezi nejznámější proponenty analýzy čísel v NHL, loňský žebříček ESPN tým zařadil do kategorie průměrně zainteresovaných a hlavní mozek celé akce, Brian Macdonald je oficiálně ředitelem analytické sekce týmu teprve druhou sezónu. Přesto považují téma za natolik důležité, že k němu uspořádali podobnou akci, která velmi pravděpodobně bude mít pokračování.

20160213_122137
Taky vás jako první napadlo, že ten červený závěs by se skvěle hodil jako dekorace pokoje? Ne? Ok…

Dojem druhý: Pojďme diskutovat

Typickou pasivně agresivní reakcí na existenci sportovní analytiky je: “A to teď jako vyhodíme kouče a budeme všechno rozhodovat podle čísel?!” Ne. Datová analýza je nástroj, který vám může pomoct. Stejně jako postřehy videokouče, fyzioterapeut nebo kondiční kouč přinášející informace o životosprávě nepřevezmou celé řízení klubu. Pokud nejste fanoušek Colorada (*smutný povzdech*), váš tým to už pochopil a přemýšlí o pár kroků dál.

#PAWS16 byla unikátní akcí proto, že nabídnula ukázkovou možnost dialogu. Zatímco předchozí akce se uskutečnily v režimu “nadšenci sobě” se spoustou podnětných objevů na základě vědeckých metod, floridský workshop vedle sebe rozesadil lidi z NHL, klubů NHL (i NFL) a hokejové bloggery a nechal je mluvit o věcech, které je trápí a které zrovna řeší.

Nebudu lhát, statistiky, podle nichž údajně jeden z přítomných skautů NHL vybírá brankáře, nevypadaly optikou posledních let příliš informovaně, ale i to patří k postupné změně, kterou přináší analýzy dat.

Ať už totiž potkávání vědeckých metod se sportem dopadne jakkoliv, výsledek nebude mít scénáristicky vypilovanou podobu Moneyballu, kdy týmy ovládne Brad Pitt za hlasitého práskání dveřmi odcházejících old-school skautů. Výsledek bude mít mnohem pestrobarevnější podobu a ten, kdo nejefektivněji spojí moudrost zažitých hokejových pořádků a možností nových technologií, vyhraje. Teda… bude mít největší pravděpodobnost vyhrát.:)

Dojem třetí: Srozumitelnost je základ

Jedno z nejzapamatovatelnějších vystoupení měl na konferenci J. B. Spisso, který má u Panthers na starosti “leadership & cultural development”. “Džejbí” je bývalý voják ze speciálních jednotek, který nám nejenže poradil, jak se sblížit s rumunskými neanglofonními vojáky v Afghanistánu (trávit s nimi čas a koukat na jejich pitomý seriály), ale hlavně zdůraznil téma důvěry a komunikace.

Ve své roli v týmu využívá zkušeností z armády a snaží se zde nastolit podobné “bratrství ve zbrani”. To obnáší komunikaci s hráči, zjišťování, co je trápí, co je naopak motivuje, jestli mají společné cíle. Ať už tento “vztahový koučing” obdivujete nebo ne, právě #PAWS16 nabídla momenty, v nichž bylo vidět, v jak odlišných termínech uvažují “datoví nerdi” na jedné straně a standardní zástupci hokejového průmyslu na straně druhé. K rumunštině to má jen kousek.

Co z toho vyplývá? Můžete mít geniální studii a přijít na skvělou konkurenční výhodu, ale pokud ji nedokážete vysvětlit lidem mimo váš okruh, zůstane schovaná v zaprášených koutech vašeho blogu. Trenér/novinář musí pochopit, o co jde, a mít důvěru k osobě a erudici autora. Jinak pochopitelně nepřijme návrhy, jejichž implementace by ho potenciálně mohla stát místo.

Být na Floridě a nekouknout se na zápas by byl nerozum
Kostka v BB&T Center, kde Panthers hrají, není kostka ale takový větší třípatrový domeček.

Dojem čtvrtý: Corsi je jen začátek

Statistická revoluce v hokeji začala u Corsi, ale dnes je nekontrolovaně rozběhlá do všech koutů fungování klubu. Pro týmy z NHL je prodej lístků největším zdrojem příjmů a je tedy obrovskou ekonomickou prioritou. Florida zaměstnává kolem třiceti lidí jen v oddělení zaměřeného na prodej, kteří denodenně využívají analytických nástrojů pro vytipování nejlepších typů nabídek pro potenciální zákazníky. NHL má zase sofistikovaný nástroj na určení ideální ceny lístků pro různé hokejové trhy.

Ale i když se soustředíte pouze na sportovní analýzy, objevíte nepřeberné množství pokladů . Rob Vollman a Michael Schuckers prezentovali na konferenci pohled do historie i na současnost hokejové analytiky, která v sobě aktuálně zahrnuje deskriptivní (co bylo) i preskriptivní (jak to dopadne) analýzy, časově normované statistiky (např. počet bodů za 60 min. na ledě) nebo třeba tzv. microstats (jako jsou vstupy do pásma). Arik Parnass na svém webu http://www.nhlspecialteams.com/ rozvíjí zasvěcené analýzy přesilovkových systémů, Jen Lute Costella zase s týmem dobrovolníků rozpitvala góly nejlepších hráčů NHL a naznačila, jak se jejich repertoáry liší. Kdo střílí góly z brejků, kdo potřebuje nahrávky, kdo chce puk? Zkoumají se brankáři, drafty, rozvoj mladých hráčů, tranzice hry nebo třeba nahrávky. A další desítky témat, s nimiž může přijít kdokoliv, kdo sleduje hokej a přemýšlí o něm.

Snažil jsem se to naznačit i v předchozích článcích, ale možná to nebylo zjevné: současné změny ve sportu nepřináší jednu novou statistiku, mění se přístup ke všem informacím.

Dojem pátý: Budoucnost má čočky

Prakticky všechna hokejová data dnes vznikají pomocí manuálního zápisu. V NHL nebo v Extralize skupina pověřených zapisuje podle pokynů sledované události (ano, v NHL jich je výrazně víc), z nich pak vznikají reporty z utkání a ty pak používají analytici. Anebo si nasbírají vlastní data z videa. To není úplně ideální proces, jednak je časově náročný (z vlastní zkušenosti: nasbírat data z jednoho zápasu z MS může trvat klidně i 7 hodin) a také docela subjektivní. Zní to překvapivě, ale často se těžko domlouváte s vlastním svědomím, jestli předchozí akce byla nepovedenou střelou nebo jen nahozením, jestli brankář o puk škrtnul, nebo ne. Když do toho přidáte desítky lidí a desítky názorů, vznikají potenciální problémy, ovlivňující kvalitu dat.

Dalším krokem statistické ofenzivy bude zavedení automatizovaného systému sběru dat. S kamerami nebo čipovými senzory už se dlouhodobě experimentuje, v mnoha sportech se už využívají. Jak připomněl Michael Shuckers, i NHL už v 90. letech měla informaci o rychlosti střely díky čipu uvnitř kotouče. V dnešní době by bylo možné z každého zápasu vytěžit obrovské množství informací – ideální postavení hráčů, pozice brankáře vůči střele, vhodnost nahrávek, průměrné rychlosti hráčů a mnoho dalšího. V baseballové MLB nebo basketbalové NBA už podobné systémy implementovali, NHL je další na řadě.

Divoké devadesátky přinesly NHL podivný svítící puk, ale taky informace o rychlosti střely
Divoké devadesátky přinesly NHL podivný svítící puk, ale taky informace o rychlosti střely

Těšte se!

Před očima se nám otevírají zcela nové světy, které můžou zásadně zatřást s mnohými zažitými postupy. Jak to vše dopadne a kdo z toho bude mít největší užitek? Kluby, hráči, média, fanoušci? Pravděpodobně všichni. Mé dojmy z Floridy se dají shrnout do jedné věty: Sportovní fanoušci žijí ve skvělé době a bude ještě líp!