Ranking av bowlingspillere

Så lenge det har vært spilt bowling, har spillere sammenlignet snittet sitt med andre. Sammenlignet med venner og kjente, spillere i klubben, kretsen og hele landet. I NBF har snittet vært benyttet til å dele spillerne inn i spilleklasser. For å bli A-spiller måtte man på 70- og 80-tallet ha snitt over 185 (herre). Dette ble øket til 190 på tinget i 1989, 195 på tinget i 1997 og til 205 på tinget i 2009. Ut fra klasseinndelingen får man delta i klassemesterskap, og spillere seedes til NM sgl/dbl ut fra snittet. I Umbro-ligaen er det også premie til de 3 med høyest snitt.


Men ranking er mer enn bare rekkefølgen på snittlisten. Plasseringen på snittlisten er i stor grad påvirket av hvilke haller man spiller i, kanskje særlig av hva slags forhold man har i hjemmehallen. Derfor har mange begynt å sammenligne ligasnitt og bortesnitt for å se "hvem som er best".

Ulike former for ranking

Den enkleste formen for rangering skjer i alle turneringer der det skal kåres en vinner. Det kan være at alle spiller like mange serier, og den med høyest pinnefall vinner. Det kan skje etter utslagsmetode (cup/matchplay) eller PP.


Seriesystemet med inndeling i divisjoner og avdelinger er en annen type ranking. I hver avdeling spiller alle mot alle og man lager en tabell for å rangere spillerne. Man kvalifiserer til høyere divisjoner ved å vinne i de lavere, og det høyest rangerte laget er vinneren i den øverste divisjon.


En variant av seriespill er Monrad. Som i vanlig seriespill starter det med at to spillere/lag trekkes mot hverandre. Vinneren får 1 poeng (evt 2 dersom det gis 1 for uavgjort). Deretter trekkes lag med like mange (eller nesten mange) poeng mot hverandre. Vinneren er den spiller/det lag med flest poeng etter et fastsatt antall runder. Dette er en form for seriespill som passer når man skal ranke mange spillere på færrest mulig runder. Det gir en ganske riktig fordeling i topp og bunn, men noe tilfeldig på midten. Dette blir benyttet endel i sjakkturneringer, men har ellers ikke så stor utbedring.


Skal veldig mange spillere rankes blir slike metoder uhåndterlig, og man må ta andre metoder til hjelp. Det kan gis plasspoeng i hver turnering etter en forhåndsbestemt skala. Hvis poengene bare gis ut i et begrenset antall turneringer er dette overkommelig, som f.eks. i EBT og PBA. Dette benyttes også av NBF for world-cupkvalifiseringsturneringer, av svenskene (rankswebowl.svenskidrott.se) og det er veldig utbredt i en rekke idretter som ski,skøyter og golf. Forskjellen er bare hvordan poengskalaen ser ut. Som regel nullstilles disse listene hver sesong, men i Golf-varianten (www.officialworldgolfranking.com) eldes poengene og teller mindre slik at de blir bort i løpet av 2 år. De deler også på antall turneringer som man har deltatt i, slik at man ikke kan spille seg høyt på listen ved å delta i veldig mange turneringer slik som f.eks i Sverige. Dette er en variant vi tidligere har hatt implementert her på bowling.no. Hver turnering ble da gitt en kategori/vekt og poeng ble gitt ut fra samlelisten. Etter innføringen av bowlingres så ble det nesten slutt på samlelister, så denne metoden ble umulig å automatisere på alle turneringer. Denne typen lister gir i tillegg feil når det er gitt handikap som har påvirket rekkefølgen.


Mere statistiske metoder er varianter av Elo-ranking. I utgangspunktet sammenlignes to spillere/lag sine rankingpoeng. Dersom den spilleren/ det laget med lavest rankingpoeng vinner, så antar man at spillerne/lagene er feil ranket, og flytter noen poeng over fra den andre spilleren/det andre laget. Hvor mange poeng som flyttes avhenger da av hvor stor poengdifferansen var. Dersom spilleren/laget med høyest rankingpoeng vinner, flyttes også noen poeng, men færre. Ulike metoder finnes da for å beregne hvor mange poeng som skal flyttes, og en slik variant er det som nå er implementer på bowling.no


For mere informasjon om ranking kan man f.eks. se:

  • www.phys.utk.edu/sorensen/ranking/Documentation/rankingofsportsteamsv01.html
  • research.microsoft.com/en-us/projects/trueskill/details.aspx
  • math.bu.edu/people/mg/glicko/glicko2.doc/example.html
  • en.wikipedia.org/wiki/Chess_rating_systems
  • en.wikipedia.org/wiki/Elo_rating_system
  • en.wikipedia.org/wiki/Deutsche_Wertungszahl
  • Hvorfor ELO-ranking? Problemstillinger

    Det har en stund vært diskusjoner om snittlisten. Å ha høyt snitt er ikke lengre ensbetydende med at man blir vurdert til team. Dersom alle hallene hadde bare en oljeprofil som de alltid la kunne man estimere par for hallene og rangere etter resultat i forhold til par. Siden hallene veksler mellom ulike oljeprofiler blir dette umulig uten at man har et estimat for hver oljeprofil.


    Det eneste man kan gjøre er å rangere i rekkefølge innen hver konkurranse, og sammenligne dette med forventningen. Ranking bør heller ikke avhenge av handikap. Dersom man vinner en turnering ved hjelp av handikap betyr ikke det at man skal ha høyere ranking enn den som ble nummer 2, så rekkefølgen innenfor hvert segment må bestemmes ut fra rent pinnefall.


    En del vil nok synes at det er merkelig at man kan vinne en turnering, men allikevel tape rankingpoeng, eller komme ganske langt ned på listen og tjene poeng. Man må huske at rankingpoengene gis ut fra forventning om resultat. Dersom man gjøre det bedre enn forventet tjener man poeng. Det er som regel mere poeng å hente i innledende spill, enn i finalespill, siden man der blir sammenlignet med mange flere.


    I finalespill er det ofte færre serier, og som f.eks. Tore Torgersen har sagt - på en serie kan alle slå alle - så dersom man slår noen på en serie i en stegfinale bør man ikke tjene like mange poeng som om man slår dem på 5 serier matchplay eller 24 seriers maraton.


    En annen problemstilling er hva man skal gjøre med gjenstarter. Skal alle starter telle like mye, eller skal bare den beste starten benyttes? Bør alle startene aggregeres og sorteres etter totalsnittet? Veikko Kotka sine 23 gjenstarter i Verdal Open nå i romjulen er det mest ekstreme eksempelet i databasen. Gjenstarter sier noe om spillestyrke, så de bør være med, men å la alle telle like mye blir også feil. Hva hvis man har brutt i en start, som f.eks. Tore Torgersen under Norwegian Open i 2005. De 2 seriene ble registrert som 6 i henhold til regelverket den gang, men hvor mange poeng skal man miste på rankingen?


    En annen problemstilling er knyttet til inndeling i ulike spilleklasser (resklasser på bowlingres). Noen turneringer har felles klasse for alle, mens noen har Damer, Herrer, Junior (U13/U11) og sågar egen veteranklasse. Dersom klassemesterskap C og D går samtidig i samme hall, og vinneren i klase C har lavere score enn enn alle i klasse D, bør spilleren tjene poeng i forhold til de andre i klasse C, men kanskje totalt sett tape. Problemet er at det kan være klasser som har spilt under andre forutsetninger, og derfor ikke skal sammenlignes med andre. Siden det ikke finnes informasjon om dette i databasen, så har vi valgt å ta alle resklasser/segmenter hver for seg. Dette har gitt noen utslag i forhold til damene, der noen er flittigere til å spille mot herrene enn andre.


    Detaljer om implementeringen

    Utgangspunktet for implementeringen var Professor Mark E. Glickman sitt paper "Dynamic paired comparison models with stochastic variances" (Journal of Applied Statistics, Vol. 28, No. 6, 2001, 673-689) Et eksempel på beregningene kan man finne her


    Den største endringen som er gjort er hvordan usikkerheten RD oppdateres. Ut fra en teori om at de som spiller 400 serier i året har mindre usikkerhet enn en med bare 10 serier, lagde vi grafen i figuren nedenfor. RD(s) = 15 +235*exp(-0.01285*s), der s er ant serier spilt siste 52 uker. Selve oppdateringen av usikkerheten er noe glattet og vises som en egen linje i spesifikasjonen av endringsdata for en uke. Denne metoden er raskere enn å iterere for å finne flyktigheten (sigma), og var lettere å forstå/stille inn parametere på.


    Nye spillere får tildelt 1500 poeng med en usikkerhet på 250. Nye spillere får også dobbelt så mange poeng første gang de rankes. For å komme på rankinglisten må man ha spilt minst 40 serier og blitt ranket mot minst 100 andre spillere. Man blir heller ikke med på rankinglisten dersom man ikke har spilt på 1 år. Spillere som kommer tilbake etter å ha vært borte vil fortsette fra den rankingscoren de hadde. Det rankingtallet som benyttes til rangering i listene er rank minus usikkerhet. Dette er gjort fordi spillere som slutter å spille vil bare beholde rank-poengene sine, og de ville ellers bare ha holdt plassen sin på listen helt til det var gått 52 uker. Nå vil de langsomt falle nedover listen inntil de etter 52 uker fjernes.


    I forhold til f.eks sjakk blir en bowlingspiller ranket veldig mange ganger på kort tid. Deltar man i en turnering med 100 spillere, så vil man med en førsteplass ha slått 99 andre. Det kan dermed bli store utslag fra uke til uke hvis man ikke setter noen begrensninger. I denne versjonen ligger følgende begrensninger inne:

  • Det er bare mulig å få/tape maks ca 75 poeng totalt i en turnering/kamp.
  • Vekting av antall serier: sqrt(ant ser/6), dvs utgangspunktet er 6-seriers turnering, og en 24 seriers maraton vil da gi dobbel score, mens en enkeltserie i en divisjonskamp vil telle bare ca 40%.
  • Gjenstarter teller mindre: Den beste starten vektes 1/1, den neste beste 1/2, den tredje beste 1/3 osv. Hvis man sammenligner den nest beste starten til en spiller med den tredje beste starten til en annen, vil det tilsammen vektes med 1/2*1/3=1/6.
  • Innenfor hver turnering/kamp blir summen av alle rank-endringer 0, dvs at snittet på alle som er ranket blir alltid 1500. Siden det er en del spillere som til enhver tid ikke vises på listen, vil snittet av de som vises kunne variere. (Beregningene til Glickman er ikke null-sum, så dette er et valg som er gjort.)
  • I telefonkamper rankes hjemelaget og bortelaget hver for seg, siden de ikke har spilt under like forhold.
  • Forbedringspotensial

    Dette er første versjon av denne typen ranking som legges ut, så vi vet at det vil være rom for forbedringer - både i forhold til presentasjon og beregning. I databasen er det nå 1403620 beregnede rank-endringer, så det sier seg selv at vi ikke har kunnet sjekke alle de 40303 kampene og 6490 turneringen som nå ligger inne.
  • Det vil alltid være en avveining av hvor stabil rankingen skal være og hvor fort nye spillere skal klare å spille seg opp. Endring av vektingen kan bli aktuelt dersom vi etterhvert ser uheldige utslag av den som benyttes nå (ant serier/makspoeng høyere i store turneringer/gjenstarter/...).
  • Det kan være ønskelig å alltid skille damer/herrer, dvs. operere med 2 lister.
  • Segmenter av typen matchplay og karusell fra bowlingres bør overføres slik at sammenligningen blir reell.
  • Det er fortsatt noen turneringer som blir registrert som samlelister, og da blir heller ikke sammenligningene reelle.
  • Gamle (store) turneringer med samlelister kunne gjerne vært splittet opp i segmenter dersom resultatlistene finnes.
  • Det er en del ligakamper som er spilt som telefonkamp, men som ikke er markert som det i databasen
  • I umbrokamper rankes alle spillerne mot hverandre i stedet for per banepar.
  • Hva kan ranklisten benyttes til?

  • Hvem som skal seedes til NM (kanskje også til lag-NM)
  • Klasseinndeling i turneringer (klassemesterskap ut fra rankinndeling)
  • Krav til minimum rank for å delta i turnering - gir turneringer med høy kvalitet.
  • Krav til maksimum rank for å delta i turnering - for å stimulere til aktivitet blant de som ellers aldri har en sjanse til å vinne noe.
  • Krav til teamspillere - eller krav for å komme i betrakning for teamet.
  • Tildele handikap ut fra ranking.
  • Få flere haller(klubber) til å velge vanskeligere oljeprofiler.
  • Innlegg

    Jan Roald Jensen (2015-01-14 21:33:59)

    Akkurat det tror jeg er lett å forklare med et eksempel: De to spillerne rett foran deg på rankinglista (ett ratingpoeng foran deg) taper 4 ratingpoeng hver. Du taper 2 ratingpoeng. Ellers ingen endringer som betyr noe for din plassering. Etter det har du rykket opp to plasser på lista.
    Mvh Jan Roald