Ett försök till slumpmässighetsindex i avslutsläget i fotboll

Som matematikintresserad (jag börjar till hösten andra året på matematikprogrammet på Göteborgs universitet) har jag fascinerats av diskussionen om tur och otur i fotboll, och hur studiet av fenomenet ”tur” ter sig olika beroende på ur vilket perspektiv man tittar. Zoomar man in och studerar fotbollen på taktisk nivå och grottar ner sig i varenda liten aktion och detalj verkar det som att man alltid kan hitta en förklaring till varför något hände på en fotbollsplan (egentligen huvudfokus på vad jag har sysslat med på hobbynivå nu under en tid). Men när man zoomar ut och tittar på fotbollen ur ett makroperspektiv statistiskt över längre tid, så finner man att mål i fotboll är väldigt slumpmässigt fördelade och att väldigt stora delar av fotbollen handlar om tur. Så hur mycket är egentligen tur? Ja, det är en oerhört svår fråga att svara på. Tur kan handla om bollar som vobblar i luften, målvakter som missbedömer en situation och gör en tavla (otur för målvakten då), en snedstuds, domslut och annat som ger det ena laget fördel på ett mer oberäkneligt sätt som skiljer sig från taktiken som lagen som spelar har satt upp.

Avslutsläget är ett sådant moment där tur verkar spela stor roll. Det finns så oerhört många parametrar som spelar in när man ska beräkna sannolikheten för att det blir mål från ett givet läge, att det blir omöjligt att göra en perfekt modell. Nu har vi xG och xGOT där modellerna utvecklas konstant över tid när mer data kan hämtas in. Men samtidigt har vi parametrarna som modellerna har väldigt svårt att på ett träffsäkert sätt förutspå. En spelare kan få en snedträff, bollen kan träffa en med- eller motspelare på vägen mot mål så att den tar en helt annan bana än vad som var tänkt, målvakten kan göra en helt galen räddning. Jag kan räkna upp hur många parametrar som helst som modellerna i nuläget har svårt ta hänsyn till. Därför kommer det alltid att finnas en osäkerhet i beräkningen av sannolikheten att det blir mål från ett givet avslutsläge. Detta gör att vissa lag kommer att överprestera eller underprestera sin avslutskvalitet oavsett hur bra den är. Jag har länge funderat på hur man kan försöka kvantifiera denna mängd av tur i avslutsläget.

Vid en första anblick kan man tänka sig att mål minus xG är ett sådant mått. Ju större positiv differens, desto mer tur och vice versa. Bristen i detta är att måttet xG endast tar hänsyn till avslutsläget och var på plan avslutet togs, men inte avslutets utgång. Gick det utanför, på mål, i stolpen, eller räddade målvakten? Här missar vi många av de parametrar jag raddade upp i inledningen. Vi har xGOT (eller post shot xG) som modellerar just detta – vad hände efter avslutet? Med xG och xGOT kan vi försöka mäta avslutskvalitet genom differensen mellan dessa, som vi kallar shooting goals added, SGA. Ju större positiv diff, desto bättre avslut eftersom man då ska ha fått högre xGOT från vad man hade för xG, dvs kvaliteten på läget.

Att mäta mängden slumpmässighet är oerhört svårt, men förra sommaren fick jag en idé och inspiration för att försöka göra precis detta på ett mycket förenklat sätt när jag skrollade igenom allsvensk avslutsdata. Jag skrev ner idén, min modell och ekvationen jag använde för att beskriva den. Kort därefter insåg jag dock att ekvationen var bristfällig, då den endast beräknade det jag var ute efter i ett av fyra möjliga fall som kunde uppstå utifrån de variabler som ingick i den, så artikelidén lades ner. Kvar fanns dock idén, och när jag diskuterade detta med en vän fick jag ny inspiration och tänkte att det kanske skulle gå att publicera ändå för att bara kasta ut idén, trots modellens brister. Efter ytterligare en genomgång av de olika scenarion som kunde uppstå utifrån variablerna i modellen försökte jag bena ut vad de olika värdena egentligen betydde. Nedan försöker jag beskriva det jag kom fram till i mitt första försök att mäta mängden slumpmässighet i avslutsläget. Till min hjälp tog jag lite allsvensk data fram till och med omgång 14 (senaste omgången då jag har all data jag behöver direkt till hands, men tillräckligt nära i tid).

Modellen och dess scenarier

När vi talar om utdelning sett till chanser är det naturligt att studera differensen mellan mål och xG, som man har gjort sedan xG-modellerna började samla popularitet. Idén gick ut på att undersöka hur stor del av denna över/underprestation som kunde förklaras av lagets/spelarens individuella avslutskvalitet. Om vi accepterar SGA som ett enkelt mått på avslutskvalitet så kan vi försöka mäta denna del genom att beräkna förhållandet mellan SGA och differensen mål minus xG. Om vi tänker oss att ett 1:1-förhållande mellan SGA och målmässig utdelning beskriver att avslutskvalitet är hela förklaringen till utdelningen, så skulle alla avvikelser från en kvot med värdet 1 ha någon slumpmässighet tillägnat sig. Därför borde slumpmässighetsindexet beskrivas av kvotens avstånd från 1, dvs genom att beräkna absolutbeloppet av kvantiteten hela kvoten minus 1, enligt nedan.

Kruxet är bara att det finns många olika scenarier att ta hänsyn till, vilket nämndes tidigare. Nedan förklarar jag hur olika scenarier påverkar modellen.

  • Positiv SGA, positiv diff

Med positiv på båda är utdelningen god där en del av det beror på bra avslutskvalitet. Om SGA är mindre än differensen kan man tänka sig att avslutskvaliteten förklarar endast en del av utdelningen, medan resten styrs av slumpen. Om SGA är större än differensen kan man tänka sig att avslutskvaliteten är bättre än utdelningen och att man faktiskt kunde väntat sig högre utdelning. Därför kan man tänka sig att ”överskottet” (avståndet från 1) beskriver hur mängden slump har påverkat utdelningen till det sämre, dvs att man har haft otur.

  • Positiv SGA, negativ diff

Med positiv avslutskvalitet men negativ diff kan man tänka sig att laget har presterat bra i avsluten när det gäller att få dem på mål på bra sätt, men när utdelningen helt enkelt inte har kommit på grund av andra faktorer. Avståndet till 1 blir då större och beskriver att en större del av avslutsläget har påverkats av slumpen.

  • Negativ SGA, positiv diff

Här gäller samma resonemang fast omvänt, när man haft tur med utdelningen trots sämre avslutskvalitet.

  • Negativ SGA, negativ diff

Här gäller samma resonemang som i det första scenariot fast omvänt när det gäller tur och otur. Eftersom kvoten här blir positiv när vi dividerar två negativa tal kan man säga att vi här beskriver lagets/spelarens ineffektivitet och sämre avslutskvalitet, snarare än tvärtom. Vi får samma typ av kvot, men den beskriver snarare hur ”dålig” någon/något har varit och hur mycket det har styrts av slumpen.

Beräknar vi absolutbeloppet kan vi nu bortse från tecknet på kvoten som styrs av dessa scenarier, och vi har nu hittat ett index som vi kan rangordna lag och spelare efter om man vill studera hur stor påverkan slumpen har haft på deras avslut. Problemet med denna rangordning är att den endast är kvantitativ och inte kvalitativ, dvs den kan inte beskriva hur slumpmässigheten har påverkat genom att enbart titta på indexsiffran – antingen till det bättre eller till det sämre – i alla möjliga fall. Då måste man göra en individuell analys av de enskilda spelarnas/lagens värden på variablerna som ingår i modellen. 

För att försöka få lite bättre överblick kan vi göra lite beräkningar efter lite allsvensk exempeldata från Fotmob/Opta till och med omgång 14 och se hur vi kan försöka förklara det index som framträder i beräkningarna.

Här har jag rangordnat allsvenska lagen efter minst index högst upp och störst längst ned, det vill säga att lagen med minst slumpmässighet i sitt avslutsläge hamnar högre upp i just den här tabellen. Hammarby är alltså laget vars avslutsläge styrs allra minst av slumpen, där kvoten mellan SGA och målmässig utdelning hamnar mycket nära 1. Det är framförallt två saker jag lägger märke till när jag ser denna tabell:

För det första: blåvitt, tredje längst ner. Detta förvånar inte. Blåvitt har haft kass utdelning under säsongen och med ett skytte som ligger i linje med lägena de har fått är det svårt att förklara hela ineffektiviteten med dåligt skytte.

För det andra, Elfsborg. Serieledarna hade ett rent ut sagt dåligt skytte fram till sommaren men har haft en fin utdelning. Ibland kan man flyga en hel säsong med utdelningen på sin sida, vilket de gulsvarta fortfarande gör.

En sak som är mycket viktig att poängtera är hur denna modell endast är en introduktion till att försöka mäta slumpmässighet i avslutsläget, och endast fungerar som ett första steg i ett större studie av dessa beting. Till exempel är SGA inget perfekt mått på avslutskvalitet (märk väl hur jag skrev ”om vi accepterar SGA som ett enkelt mått på avslutskvalitet” tidigare i texten). Fler parametrar kan givetvis tas med i modellen för att öka dess träffsäkerhet. Mitt mål med denna text var att försöka börja med att hitta en metod för att över huvud taget kunna kvantifiera något så svårt som slumpmässighet.

Lämna en kommentar

Designa en webbplats som denna med WordPress.com
Kom igång