Innováció a futballban, avagy a legújabb, mesterséges intelligencián alapuló xG-modell
Az adatok és a statisztikák az elmúlt években egyre nagyobb népszerűségnek örvendenek a labdarúgás világában. Ennek az evolúciónak az egyik legismertebb „terméke” a várható gólok mutató, avagy a sokak által bizonyára xG (expected goals) néven ismert index. Cikkünkben annak járunk utána, hogy miként és milyen módon tökéletesítik a modellt annak érdekében, hogy a lehető legtöbb információt lehessen egy konkrét szám formájában átadni az érdeklődők számára.
Amióta az xG-t 2012-ben Sam Green, az Opta munkatársa bevezette, ez a mérőszám az egyik legelterjedtebb és leglátványosabb mutatóvá nőtte ki magát a labdarúgó analitikában. A The Analyst-en megjelent irományban megismerkedhetünk a Stats Perform legújabb xG-modelljével, a szakanyag fordításával és lényegének megragadásával pedig igyekszünk mindezt magyar nyelven is közkinccsé tenni annak érdekében, hogy a labdarúgást övező közbeszédben egyre jobban elterjedhessenek a különféle haladó paraméterek.
A várható gólok mutató tulajdonképpen a mérkőzésen feljegyzett kapura lövési kísérletek minőségét hivatott számszerűsíteni, és azt mondja meg, hogy egy adott szituációból a történelmi minta alapján átlagosan milyen valószínűséggel születik gól. Közel egy évtizeddel azóta, hogy a Stats Perform először bevezette az xG fogalmát, a modell rendkívül sok változáson ment keresztül, és ma már jóval kifinomultabb képet tud adni, mint korábban bármikor.
Az adatgyűjtés a futballban egy folyamatosan fejlődő folyamatként jellemezhető, ugyanis minden egyes kiegészítéssel és tökéletesítéssel egyre erőteljesebb betekintést nyerünk a pályán zajló események hátterébe. Ezen adatpontok inputként való felhasználása lehetővé teszi a minél összetettebb modellek megalkotását és a próbálkozások minőségének minden eddiginél pontosabb és összetettebb értékelését.
Az xG-ről röviden
Noha korábban már volt szó az xG értelmezéséről, elevenítsük fel néhány gondolat erejéig, hogy mire is való ez a meglehetősen népszerű paraméter. A várható gólok statisztikai modell azt mutatja meg, hogy egy adott focista egy konkrét próbálkozásból milyen valószínűséggel szerezhet gólt. A megfelelő matematikai módszertan segítségével minden lövéshez egy 0 és egy 1 közötti értéket rendelhetünk, ahol előbbi egy olyan eseményt jelent, amelyből lehetetlen bevenni az ellenfél kapuját, míg utóbbi gyakorlatilag a biztos góllal egyenértékű.
Miben különbözik a Stats Perform legfrissebb várható gól-modellje?
A Stats Perform mesterséges intelligenciája, a Qwinn több, mint félmillió lövést elemzett a korábbi versenykiírásokból és szezonokból, mindezt annak érdekében, hogy soha nem látott precizitással és funkciókkal ruházza fel a legújabb xG-modellt. A Qwinn több, mint ötször annyi tényezőt vesz figyelembe, mint a meglévő modell, és azt vizsgálja, hogy ezek a változók hogyan befolyásolják egy adott lövés „góllá válásának” esélyét. Ezek az xG kimenetek és értékek így már egy jóval fejlettebb modellezési technika, az úgynevezett mesterséges neurális hálózatok által kerülnek meghatározásra.
Ez az új konstrukció továbbra is figyelembe veszi a meglévő modell olyan alapvető jellemzőit, mint például a lövések kaputól való távolsága és szöge, de ezeket a faktorokat innentől kezdve megannyi további kiegészítő paraméterrel látják el. Ilyen extra szempont például az, hogy a lövést megkísérlő játékos mennyire látja tisztán a kapu felületét, vagy az, hogy az ellenfél játékosai milyen erősségű nyomást helyeznek az éppen lőni készülőre. A vetélytárs kapus helyezkedésének pontos meghatározása mérhetővé teszi a labda gólvonaltól mért távolságát, a kapuval bezárt szögét, illetve magának a portásnak a lövésre való rálátásának mértékét.
Az új modell az előbbieken túl azt is számításba veszi, hogy a lövést leadó játékos melyik lábát használta, valamint azzal is kalkulál, hogy a próbálkozás egy kapáslövés, vagy éppen fejes formájában valósult-e meg. Ezen kívül a lövést megelőző passz típusát is különböző súllyal veszi számításba, attól függően, hogy milyen fajta átadás vezetett az eseményhez. A valóság lehető legprecízebb megragadása érdekében azzal is számol a modell, hogy a lövés egy kipattanó/visszapattanó, vagy mondjuk egy úgynevezett „first-touch shot” kísérletet követően született-e.
Nézzünk is két példát arra vonatkozóan, hogy mit jelent a gyakorlatban a lövést végrehajtón lévő nyomás és a kísérlet kapuval bezárt szöge. Előbbi, vagyis a „shot pressure” azt próbálja számszerűsíteni, hogy a lövéssel vállalkozót milyen intenzitással veszik körül az ellenfél játékosai annak érdekében, hogy minél inkább megzavarják a helyes kivitelezésben. Míg utóbbi, azaz a „shot clarity” annak a megállapítására jött létre, hogy a kísérletet végrehajtó játékos – egészen pontosan a labda – mekkora szöget zár be a kapuval.
Forrás: The AnalystMost, hogy már olyan paramétereket is figyelembe veszünk, mint a védők és a kapus pozíciója, helyezkedése, a korábbinál jóval precízebb és megbízhatóbb modell áll rendelkezésünkre. Valójában tehát a korszerűsített modell legnagyobb előnye abban rejlik, hogy a gólszerzési lehetőségek bekategorizálása és számszerűsítése innentől kezdve egy nagyságrendekkel finomabb mérési skálán valósítható meg.
Hatalmas mint, rengeteg lövés, mérhető különbségek
A Stats Perform az Opta adatainak köszönhetően egy olyan modellt tudott megalkotni, amely több, mint 66 000 játékos több, mint 2,5 millió lövésének xG-értékével operál. Az új modell számai ugyan nem térnek el drasztikusan a régebbi verzió által kalkulált értékektől, a különbség ezzel együtt korántsem elhanyagolható.
Ha megnézzük a Premier League 2021-22-es szezonjában a február elejéig leadott 5525 lövést, akkor láthatóvá válik a két számítási metódus közötti differencia. Míg a mintában szereplő próbálkozások átlagos minősége (xG/lövés) a korábbi modell szerint 0,11 volt, addig az új változat alapján már 0,12. Persze, elsőre azt lehetne gondolni, hogy ez a 0,01-es eltérés nem oszt, nem szoroz, de nagy mintán, hosszú időtávon nézve igenis más megvilágításba helyezi a kísérletek minőségének értékelését.
Noha lehet, hogy viszonylag kis mintáról van szó, az említett időszakban feljegyzett 43 „nyílt gólhelyzet” (open goal chances) a régi modell szerint összesen 22,7-es xG-t eredményezett, míg az újabb verzió már 30,6-os kumulált xG-t határozott meg, ami jóval közelebb áll az ezekből a szituációkból ténylegesen született gólok számához (28).
Az xG-értékek apró módosulása olyan változtatásoknak köszönhető, amelyek az új modellben kifinomultabbá teszik az egyes lövések minőségét meghatározó paraméterek skáláját. A modell az olyan szempontokat is figyelembe veszi tehát – kapus helyezkedése, védők nyomásgyakorlása –, amik nélkül valószínűleg eltérő kvalitású helyzetekről beszélhetnénk, ezek megléte viszont nagyban árnyalhatja a képet.
A két verzió összevetése Diogo Jota helyzetein keresztül
Ha a top 10, összességében legmagasabb xG-vel rendelkező játékos rangsorát nézzük a nemrég befejezett szezon február elejéig tartó időszakában, akkor azt látjuk, hogy közülük 8 pozíciója is változatlan marad az új metódus ellenére. A kumulált értelemben legmagasabb várható gól-értékkel bíró 5 játékos esetében egyet kivéve mindegyiknél pozitív irányú eltérést eredményez a korszerűsített modell.
Az idényt kifejezetten ígéretes formában kezdő Diogo Jota xG-je például 1,2-vel nőtt a finomításoknak köszönhetően, és ha megnézzük a mintában szereplő 59 lövését, akkor rögtön egyértelművé válik számunkra, hogy mi is az oka ennek a differenciának. Míg a régi modell szerint a portugál támadó helyzeteinek átlagos minősége 0,19-es xG-vel volt jellemezhető, addig az aktualizált számítási metódus már 0,21-es értéket határoz mez. A különbség javarészt azokból a tizenhatoson belüli próbálkozásokból eredeztethető, amelyeknél a kapus helyezkedése és a védők pozícióinak bekategorizálása a korábbinál még pontosabban került meghatározásra.
A két mérés közötti legnagyobb pozitív eltérés (+0,22-es xG/lövés) egy Southampton elleni bajnoki mérkőzésen szerzett találat alkalmával mutatható be a legszemléletesebben. Szalah jobb szélről érkező passza teljesen őrizetlenül találta az ötösön belül érkező Jotát, akinek már csak be kellett pöccintenie a labdát az előtte üresen tátongó kapuba.
Forrás: The AnalystOlyan szituációra is találunk példát persze, amikor egyáltalán nem volt olyan egyszerű kihasználni az adódó lehetőséget, mint ahogy azt elsőre gondolhattuk volna. A képen azt a helyzetet láthatjuk, amikor az Aston Villa védője, Ezri Konsa túl röviden hátra tett passza kis híján gólhoz vezetett, de hála Emiliano Martínez remek anticipációs képességének, végül nem bosszulta meg magát a könnyelmű hiba.
Forrás: The AnalystAnnak ellenére, hogy a gólszerzésben reménykedve viszonylag közelről adhatta le lövését a Liverpool csatára, az argentin hálóőr parádésan robbant ki kapujából, így remekül zárva a szöget. Az új modell a fent ecsetelt tényezőket számításba véve 0,06-os xG-vel jegyezte fel a szóban forgó lehetőséget, míg a korábbi verzióban 0,36-os várható gól értéket társítottak hozzá.
Összegzés
Ahogy a futball világában alkalmazható technológiák és mérési folyamatok változnak, az ún. „tracking data” és a számítógépes látás folyamatosan növekvő hozzáférhetőségével a modellek fejlődése elkerülhetetlen. Vannak viszont olyan dolgok, amelyek továbbra is ki fogják állni az idő próbáját. Ilyen például az xG-modell koncepciója, mely mindig is a lövések minőségét lesz hivatott számszerűsíteni. A különbség csupán abban áll, hogy a kalkulált értékek egyre informatívabbak lesznek, ami által a valós történések leírása kifinomultabb módon ragadható majd meg, mint korábban bármikor.
Kiemelt kép: intelligentfc.com