Title

Talnørderne revolutionerer NBA (del 1)

Væk med de lange toere, ind med hjørnetreere, dunk og straffekast. Den største udvikling i disse år inden for basketball foregår ikke på selve banen, men på computerskærmene, hvor man med mere og mere avancerede statistikredskaber kan udpinde spillernes præstationer.

Revolutionen, som det må kaldes, er båret af to udviklinger på en gang.

  • For det første er der den teknologiske udvikling, hvor man følger og aflæser hver eneste bevægelse hos den enkelte spiller (”player tracking”) og omsætter dette input til enorme datamængder, der kan behandles statistisk.
  • Den anden del er den menneskelige side, hvor flere og flere general managers hyrer specialister i ”databasketball” og trænere, der går op i at bruge disse stats. Og så er der selvfølgelig spillerne, der skal udvikle sig til at være så effektive som muligt.

Et typisk eksempel er Boston Celtics, hvor GM Danny Ainge godt nok selv er lige en generation for gammel til for alvor at omfavne udviklingen. Men han har valgt at hyre ligaens yngste head coach, Brad Stevens, som er kendt for at gå op i stats, og dennes stat-ekspert fra tiden ved Butler University, Micah Shrewsbury.

 

Scoring kommer på formler

For Celtics betyder det bl.a., at stort set alle spillere skyder flere treere end tidligere. Det gælder f.eks. Jeff Green, Rajon Rondo, Avery Bradley og Jared Sullinger. Forklaringen er simpel: Hvis bare man rammer et ud af tre trepointsforsøg, svarer det til, at man rammer hver anden toer. Og det er en fin statistik, når det gælder skud udefra.

 

eFG%

Den statistik, som man ofte bruger til at vurdere om en spiller er en effektiv skytte, er eFG% (effective Field Goal percentage):

eFG% = 100 * (FG + 0,5*3PT) / FGA Som det fremgår tæller en trepointsscoring her 1,5 gange så meget som et almindeligt skudforsøg, eFG% statistikker kan bl.a. findes på basketball-reference.com, NBA.com og 82games.com

 

TS%

En anden statistik, som bliver brugt ofte, er TS% (True Shooting percentage). Den indregner også straffeskud:

TS% = 100 * (1/2) * PTS / (FGA + 0,44*FTA)

Det ser lidt underligt ud med den faktor 0.44, men man skal tænke på, at ikke alle straffekast kommer på baggrund af fejl ved et brændt topointsskud. Der er bl.a. tekniske fejl, and-one-spil og fejl ved trepointsskud. Tidligere statistikker har vist, at et straffeskud svarer til 0,44 afslutninger i gennemsnit. Klubberne har nok selv haft mere præcise tal, men det er først med player tracking, at man har kunnet lave en helt præcis statistik for alle spillere i NBA. Når man taler TS% er det formlen ovenfor der henvises til. Man finder TS% på bl.a. NBA.com og basketball-reference.com.

 

PPP

PPP er en scoringsstat, der også indregner turnovers. Nogle udregner den som Points Per Possession, mens andre regner Points Per Play, så man skal lige være opmærksom på, om det er det ene eller det andet begreb, der bruges.

Når der tales om Per Possession, så kan der være flere afslutninger i samme angreb, mens man regner det for et nyt Play, når der tages en angrebsrebound.

Den mest brugte formel for Points Per Possession er:

PTS/POSS, hvor

POSS = FGA + 0,44*FTA + TOV

Her indgår igen de 0,44 afslutninger som et straffeskud svarer til (og som ikke fremgår af kampstatistikkerne), og så har man altså lagt turnovers oveni.

 

Individuelle procenter der tæller

Hvis man vil bag om de normale stats (assists, rebounds, blokerede skud, stjålne bolde, mistede bolde), så bruger man i stedet den procentdel, som en spiller har/tager ud af antal mulige. På den måde fjerner man støj fra, at nogle hold spiller hurtigere end andre og dermed skaber mere af alle stats. Desuden tager man hensyn til om en spiller får 20 eller 40 minutter per kamp og dermed flere muligheder for at assistere, rebounde osv.

  • REB% (Rebound percentage) er den andel rebounds, som en spiller henter ned ud af 100 mulige rebounds.
  • AST% (Assist percentage) er den andel af medspillernes scoringer, som en spiller leverer assists til. Skal ikke forveksles med %AST (Percentage assisted), som er den andel af en spillers scoringer, hvor der er noteret en assist fra en medspiller.
  • BLK% (Block percentage) er den andel af modstandernes skud, som en spiller får blokeret.
  • STL% (Steal percentage) er en spillers antal steals per boldbesiddelse til modstanderne.
  • TOV% (Turnover percentage) er tilsvarende antal mistede bolde per boldbesiddelse til eget hold.
  • USG% (Usage percentage) er hvor mange boldbesiddelser til eget hold, som en spiller ”bruger” til enten scoringsforsøg, mistet bold eller at blive fejlet. Formlen er: USG%=100*(FGA+TOV+0.44*FTA)/POSS

 

Jagten på enhedsformlen

Når man diskuterer, hvem der er den bedste basketball-spiller, vil der altid være en statnørd, der på et tidspunkt spiller trumfkortet PER (Player Efficiency Rating), og hvis der er andre statnørder involveret i diskussionen vil de blive fulgt up af Win Shares, APM (Adjusted Plus-Minus) eller PIE (Player Impact Estimate). Alle fire er forsøg på at lave en enhed, der viser hvor stor indflydelse en spiller har på kampene.

 

Player Efficiency Rating (PER)

PER er udviklet af John Hollinger, som oprindeligt var aktiv i Association for Professional Basketball Researchs debatforum. Hans arbejde førte ham først til ESPN.com, hvor han blev den faste stat-mand og som adopterede PER. P.t. arbejder Hollinger som vice-GM for Memphis Grizzlies, hvilket understreger, hvor stor pris NBA franchises sætter på statistik-folkene.

Selve udregningen af PER er ganske langhåret, men inddrager alle tal fra den almindelige box score, inklusive spillede minutter. Kritikken af PER er tredelt: For det første tæller den ikke defensiv bortset fra blocks, steals og rebounds. For det andet belønner PER i høj grad volumenscorere, selv når de har lav effektivitet. Og for det tredje kan man ikke rigtigt bruge tallet til andet end at rangere spillere.

 

Win shares

Win shares er udviklet af basketball-reference.com. Man kan have både offensive og defensive win shares. Begge dele udregnes på baggrund af nogle formler som basketball-stat-guruen Dean Oliver har udviklet, og som er beskevet i hans bog ”Basketball On Paper”.

Ideelt set burde summen af win shares for spillerne på et hold være lig med holdets antal sejre i sæsonen, men der er en vis fejlmargin. Dog ikke større end, at det giver mening.

Lige som PER bygger win shares på box scores, men dog også med et forsøg på at indregne defensiv.

 

Adjusted Plus-Minus (APM), RAPM og Real Plus-Minus

APM er som betegnelsen antyder en justeret udgave af den ”Rå” Plus-minus-statistik. I den rå udgave tæller man blot, hvor mange points et hold scorer mere eller mindre end modstanderne, når en enkelt spiller eller en bestemt spillerkonstellation er på banen. Typisk vil man udregne hver enkelt spillers plus-minus per 100 boldbesiddelser eller lign.

Plus-minus-statistikken har nogle klare svagheder, især når man ser på den enkelte spiller, da den ikke tager hensyn til medspilleres eller modstanderes styrke. Det er derfor APM er blevet udviklet.

APM har en lidt spøjs historie bag sig: Oprindeligt blev metoden udviklet af Wayne Winston og Jeff Sagarin. De kaldte den WINVAL, men formlerne bagved blev aldrig offentliggjort. Angiveligt betalte Mark Cuban en anseelig sum for rettighederne til brug for hans Dallas Mavericks. Senere skrev en anden statistiker, Dan Rosenbaum, en artikel hvor han beskrev metoden bag, og han kaldte enheden for APM. Rosenbaum blev så selv hyret af Cleveland Cavaliers, men hans artikel gjorde det muligt for andre at genskabe hans arbejde.

APM bruger noget man inden for statistik kalder regressionsanalyse, og det kræver en hel del regnekraft bare at regne en hel sæson igennem. Man kan finde lister på basketball-value.com, som også har de rå data liggende.

Regularized APM (RAPM) er en fintuning af APM, hvor man fjerner statistisk ”støj”, hvilket vil sige at store udfald fra normalområdet ikke får indflydelse på den samlede bedømmelse. Hvis en konstellation f.eks. normalt vinder deres del af kampen med fire points, så vil en enkelt kamp med minus på 40 points ikke pludselig svare til 10 tabte kampe.

Det seneste skud på stammen er en videreudvikling af RAPM, som ESPN.com har taget i brug i denne måned: Real Plus-Minus, som den tidligere Phoenix Suns-analytiker Jeremias Engelmann står bag. Her har man ikke bare delt op i konstellationer, men tager højde for hver enkelt spillers bidrag til konstellationen. Real Plus-Minus er delt op i en offensiv og en defensiv rating.

 

Player Impact Estimate (PIE)

Player Impact Estimate er NBA.coms bud på en enhedsformel. Lige som PER inddrager den alle box score variable i en kamp. Det særlige ved PIE – og som har givet navn til forkortelsen – er, at man for hver kamp tæller samtlige spilleres bidrag og fordeler dem i et lagkagediagram (”pie chart”), så det samlede bidrag fra alle spillere udgør 100 procent. Hver spiller får derefter tildelt deres andel af ”kagen” som et procenttal. I formlen herunder er alle stats med Gm=Det samlede antal i kampen.

Set over en sæson lægger man blot PIE-værdierne sammen og deler med antal kampe, spilleren har spillet.

 

Det bliver mere avanceret endnu

Alle de ovenstående stats kan enten aflæses direkte eller udregnes ud fra box scores – bortset fra nogle få tal, som stadig er forholdsvis nemme at gøre op ved siden af. Og alene derfor fortæller de langt fra sandheden om en basketball-spillers bidrag på banen.

Tal, der måler scoringer, assists osv. har en tendens til at overvurdere betydningen af den, der har bolden i hænderne, mens +/- tallene nærmest går i den modsatte grøft og undervurderer dem.

Selv tal, der kombinerer de to stat-typer, har en ganske stor risiko for at ramme ved siden af, fordi man ikke kan aflæse, om en spiller f.eks. har lavet 30 perfekte afleveringer, hvor medspillerne bare har brændt deres frie skud.

Det kan man nu aflæse med player tracking. Man kan simpelt hen se, om en aflevering fører til et frit skud eller et presset osv. Man kan også aflæse om en spiller er i kamp om rebounden, eller den dumper ned i hovedet på ham.

Vi kigger nærmere på player tracking, og hvad det giver af muligheder, i næste omgang af ”Talnørderne revolutionerer NBA”.

 

Forkortelser/oversættelser:

eFG%: Effektiv skudprocent

FG: Antal scoringer (både toere og treere)

3PT: Antal trepointsscoringer

FGA: Antal skudforsøg (både toere og treere)

TS%: Sand skudprocent

PTS: Points

FTA: Antal straffeskud

PPP: Points per boldbesiddelse (se definition)

PTS: Scorede points

POSS: Boldbesiddelser

TOV: Mistede bolde

 

Yderligere læsning:

Oversigten som inspirerede denne artikel: http://www.goldenstateofmind.com/2011/12/6/2602153/advanced-stats-primer

Mere om Adjusted Plus-Minus: http://www.countthebasket.com/blog/2008/06/01/calculating-adjusted-plus-minus/

Mere om Win-shares: http://www.basketball-reference.com/about/ws.html

Mere om PER: http://www.basketball-reference.com/about/per.html

Mere om Real Plus-Minus: http://espn.go.com/nba/story/_/id/10740818/introducing-real-plus-minus

Basketballstatistik-ordbog: http://stats.nba.com/glossary.html

Facebook comments