Header

Header

woensdag 23 januari 2019

Racevoortgangsgrafieken

Formule 1-races kunnen heel hectisch verlopen. Door verschillende strategieën kunnen coureurs op verschillende momenten in de race snel zijn, waardoor de races lastig te volgen zijn. Zelfs achteraf is het niet altijd in een oogopslag duidelijk wie snel was en wie niet.

Om dit inzichtelijker te maken zijn er twee methodes. De eerste methode is om de achterstand op de koploper weer te geven. Dit geeft een goed beeld van hoe de race verloopt, maar omdat het tempo van de koploper niet constant is en de koppositie van handen kan wisselen, is het lastig om de absolute snelheden uit de grafiek te halen. Beter is het dus om een constant tempo als referentie te hanteren, bijvoorbeeld de gemiddelde snelheid van de winnaar. In het Engels worden deze grafieken vaak Race History Charts genoemd. Zoals wel vaker bestaat hier geen Nederlandse term voor. Ik denk dat racevoortgangsgrafiek de beste vertaling is, dus zal ik deze term in het vervolg gebruiken.

Het idee van een racevoortgangsgrafiek is dus om op ieder moment in de race de achterstand op het gemiddelde tempo van de winnaar te plotten, waarbij bijvoorbeeld ronden achter de safetycar buiten beschouwing worden gelaten. Op de y-as staat de achterstand op het gemiddelde tempo. Positieve waarden geven dus een voorsprong aan. Dit betekent dat als de grafiek stijgt de coureur sneller gaat dan gemiddeld en langzamer als de grafiek daalt. Verder is de achterstand van de winnaar aan het begin en het eind van de race natuurlijk precies 0.

Hieronder heb ik in magenta de rondetijden van Max Verstappen in de Grand Prix van Spanje in 2016 (zijn eerste zege) weergegeven. De witte lijn is zijn gemiddelde rondetijd. De rode lijn geeft rondetijden weer die één seconde trager dan gemiddeld zijn, de groene lijn geeft rondetijden weer die één seconde sneller dan gemiddeld zijn en de blauwe lijn is twee seconden sneller.

Rondetijden Max Verstappen van de Grand Prix van Spanje in 2016.

De rondetijden laten een soort zigzagpatroon zien dat kenmerkend is voor het huidige Pirelli-tijdperk: naarmate de banden slijten lopen ze op, om direct na een bandenwissel weer flink te verbeteren. De rondetijden achter de safetycar (ronde 1 t/m 3) zijn buiten beschouwing gelaten en de pitstops (ronde 12-13 en 34-35) vallen ruim buiten het bereik van de grafiek omdat ze veel trager zijn.

Te zien is dat Verstappen zijn snelste ronde van de middag (1:28,816) direct na zijn tweede pitstop neerzette. De omstandigheden waren toen optimaal voor hem, met nieuwe banden en een halflege brandstoftank. In het vervolg liepen zijn rondetijden geleidelijk op doordat zijn banden grip begonnen te verliezen. In de laatste ronde waren zijn banden dusdanig versleten dat hij met een lichte auto nog trager ging dan in het begin van de race met een volle brandstoftank. Uitgezet tegen zijn gemiddelde tempo krijgen we de volgende grafiek:

Racevoortgangsgrafiek Max Verstappen van de Grand Prix van Spanje in 2016.
In magenta is Verstappens racevoortgang geplot. In de achtergrond staan de hulplijnen getekend van één seconde per ronde trager (rood), het gemiddelde racetempo (wit), één seconde per ronde sneller (groen) en twee seconden per ronde sneller (blauw). De grafiek is vlak op het moment dat Verstappen net zo snel gaat als zijn gemiddelde rondetijd. Dit gebeurt in ronde 9, 31 en 65. Omdat de pitstops volgens de grafiek ongeveer 20 seconden kostten, moest Verstappen in de race ongeveer 40 (2 × 20) seconden goedmaken ten opzichte van zijn gemiddelde. Dat deed hij vooral na zijn tweede stop. Tot ongeveer ronde 50 volgt hij de blauwe lijn, maar daarna lopen zijn rondetijden behoorlijk op, waardoor de grafiek steeds verder afvlakt.

Het mooie van een racevoortgangsgrafiek is dat incidentele schommelingen in rondetijden niet veel invloed hebben op de vorm ervan, waardoor ze bruikbaar zijn om te extrapoleren waar coureurs hadden kunnen finishen als ze niet waren uitgevallen, als ze een tragere rivaal eerder waren gepasseerd, of als ze een slimmere strategie hadden gehad. In dit geval is bijvoorbeeld duidelijk aan de grafiek te zien dat Verstappens tweede stop hem uiteindelijk een hoop tijd opleverde. Hieronder heb ik Verstappens racevoortgang geëxtrapoleerd als hij niet zijn eerste stop had gemaakt (de rode stippellijn) of niet zijn tweede stop (de blauwe stippellijn).

Racevoortgang met hypothetische strategieën.
Te zien is dat Verstappen bij beide stops ongeveer 10 ronden nodig had om het tijdsverlies in de pits goed te maken. Minder dan twee keer stoppen was dus echt geen optie. Een extra bandenwissel was mogelijkerwijs sneller geweest, maar aangezien inhalen in de race heel moeilijk was en Räikkönen in de race sneller was dan beide Red Bulls, was dat geen optie. Verstappen moest Räikkönen in de slotfase op steeds slechter wordende banden achter zich houden, wat een van de spannendste finishes van de laatste jaren opleverde.

Racevoortgangsgrafieken zijn dus heel nuttig om het verloop van een race in kaart te brengen en om hypothetische vragen redelijk overtuigend te kunnen beantwoorden. In het vervolg zal ik dus ook veel met racevoortgangsgrafieken werken.

vrijdag 11 januari 2019

Wie was de allersnelste coureur over één ronde?

In de Formule 1 zijn alle auto's verschillend, wat aan de ene kant zo zijn charme heeft, maar aan de andere kant frustrerend is omdat daardoor directe vergelijkingen niet gemaakt kunnen worden. Was Hamilton in een Ferrari ook kampioen geworden? Was Verstappen in een Mercedes fluitend wereldkampioen geworden? Was de Williams vorig jaar zo slecht of lag het puur aan de rijders? Het zijn vragen waar nooit met zekerheid antwoord op gegeven kan worden, al kun je met goede wiskundige modellen een heel eind komen.

Het idee achter deze modellen is dat coureurs gedurende hun carrière steeds met hun teamgenoten worden vergeleken. Door de coureurs met hun teamgenoten te vergelijken, ontstaat een heel web aan vergelijkingen, waardoor het goed duidelijk wordt welke coureurs snel of succesvol zijn en welke niet. De modellen kunnen ook gebruikt worden om coureurs uit verschillende tijdperken met elkaar te vergelijken. Wie was de beste coureur aller tijden? Is Hamilton beter dan Senna? Die vragen kunnen tot op zekere hoogte beantwoord worden.

Modellen die race-uitslagen gebruiken, kunnen al snel heel ingewikkeld worden. Wat moet er bijvoorbeeld gedaan worden met coureurs die in de race uitvallen? Daarom heb ik me toegelegd op iets eenvoudigers: de kwalificatie. Het doel van de kwalificatie natuurlijk heel simpel: gewoon een zo snel mogelijke ronde rijden. Precies daarom zijn kwalificatie-uitslagen makkelijk te analyseren. Door teamgenoten onderling te vergelijken, kan in kaart worden gebracht wie er over één ronde snel waren en wie niet.

Voor de analyse heb ik alle kwalificatietijden vanaf 1983 gebruikt. Daarbij heb ik teamgenoten per jaar met elkaar vergeleken. Hierbij heb ik alleen kwalificatietijden meegenomen waarin beide coureurs hun snelste tijd van het weekend in de kwalificatie reden, om te voorkomen dat de resultaten al te veel door vreemde uitbijters beïnvloed worden. Ook heb ik alle coureurs die minder dan drie races in een seizoen reden buiten beschouwing gelaten.

Kwalificatieratings
Om de uitkomsten wat inzichtelijker te maken, druk ik de snelheid van de coureurs uit in een rating, net als bij schaken. Hoe hoger de rating, hoe sneller de coureur en hoe groter de kans dat hij sneller is dan zijn teamgenoot in de kwalificatie. De kans hierop hangt niet alleen af van het snelheidsverschil tussen de coureurs, maar ook van de spreiding. Vroeger, in de tijd van de turbomotoren en de kwalificatiebanden, was het lastig om heel precies te rijden. Het gevolg was dat de prestaties van coureurs in de kwalificatie ook sterk konden wisselen. De onderstaande grafiek geeft aan hoe de spreiding (de standaarddeviatie) in rondetijden geleidelijk aan is afgenomen.

Standaarddeviatie van het snelheidsverschil tussen teamgenoten in procenten door de jaren heen.
Waar de spreiding halverwege de jaren 80 nog hoog was (de standaarddeviatie was meer dan een procent), nam hij aan het eind van het turbotijdperk flink af tot ongeveer 0,7% in de eerste helft van de jaren 90. Het schrappen van de vrijdagkwalificatie in 1996 lijkt voor een volgende daling te hebben gezorgd. Afgezien van een kleine opleving halverwege de jaren 2000 (door de invoering van de kwalificatie over één ronde) is de spreiding sindsdien ongeveer gelijk gebleven met een standaarddeviatie van ongeveer een half procent. Dit betekent bijvoorbeeld dat een coureur die nu een procent trager is dan zijn teamgenoot (bijvoorbeeld Stroll ten opzichte van Massa of Palmer ten opzichte van Hülkenberg in 2017) naar verwachting eens in de veertig keer sneller is. In de jaren 80 zou die kans nog één op vijf zijn geweest. Om een teamgenoot te domineren was vroeger dus een groter snelheidsvoordeel nodig.

De afname van de jaarlijkse spreiding van de bovenstaande grafiek is bij benadering exponentieel. In de analyse gebruik ik daarom een exponentiële benadering. In het begin van de dataset is de standaarddeviatie gemodelleerd op 0,9%, aflopend naar 0,44% in 2018. Gebaseerd op het gemiddelde snelheidsverschil tussen ieder paar teamgenoten (469 in de dataset) en de gemodelleerde spreiding heb ik voor alle teamgenoten de gemodelleerde kans berekend dat ze elkaar in de kwalificatie verslaan. Die kans kan zo goed als 100% zijn, zoals bij Senna en Nakajima in 1987, of bijna precies 50-50, zoals bij Hamilton en Rosberg of Verstappen en Sainz een aantal jaar geleden. Vervolgens heb ik de ratings van alle coureurs iteratief aangepast zodat ze zo goed mogelijk overeenkomen met de gemodelleerde kansen. De top van de (voorlopige) ratinglijst ziet er als volgt uit (onbetrouwbare ratings heb ik cursief gemaakt en Senna heb ik op 2800 gezet):

1. Manfred Winkelhock 2903
2. Ayrton Senna 2800
3. Charles Leclerc 2797
4. Nico Rosberg 2722
5. Max Verstappen 2712
6. Lewis Hamilton 2699
7. Michael Schumacher 2679
8. Fernando Alonso 2664
9. Daniel Ricciardo 2660
10. Sebastian Vettel 2640
11. Nico Hülkenberg 2635
12. Alain Prost 2617
13. Elio de Angelis 2615
14. Sebastien Buemi 2614
15. Carlos Sainz 2612
16. Heikki Kovalainen 2578
17. Adrian Sutil 2576
18. Paul di Resta 2569
19. Romain Grosjean 2567
20. Sergio Pérez 2564
21. Valtteri Bottas 2564
22. Jarno Trulli 2560
23. Robert Doornbos 2559
24. Christijan Albers 2550
25. Anthony Davidson 2546
26. Robert Kubica 2543
27. Keke Rosberg 2535
28. Pascal Wehrlein 2535
29. Mark Webber 2534
30. Giancarlo Fisichella 2534

In het ratingsysteem komt een ratingverschil van 100 punten neer op een kansenverhouding van ongeveer 64-36 en 200 punten op een kansenverhouding van 76-24 (de standaarddeviatie in het ratingsysteem is op 200√2 gezet). In dezelfde auto zou Senna, als hij met een tijdmachine uit het ongelukkige jaar 1994 naar nu zou zijn gevlogen, dus in 64% van de kwalificaties sneller zijn dan Hamilton. Opvallend genoeg zitten er veel coureurs uit het moderne tijdperk (de vetgedrukte namen) in. Dat is geen toeval. F1 metrics suggereert ook dat de kwaliteit van de coureurs vanaf 2010 over de gehele linie enorm omhoog is gegaan.

In de ratings komt Leclercs geweldige debuutseizoen goed naar voren. Hoewel zijn rating nog onzeker is, verwacht ik veel van hem voor 2019. Verstappen is volgens het model over een ronde iets sneller dan Hamilton, ondanks dat hij nog nooit op pole heeft gestaan. Ex-Red Bull-teamgenoot Ricciardo was echter een harde noot om te kraken, getuige zijn negende plaats op de lijst, vlak achter de grote Alonso. De ratings voorspellen voor dit jaar een spannend kwalificatieduel tussen Ricciardo en Hülkenberg.

Wat lager op de lijst treffen we zowaar een aantal Nederlanders aan: Robert Doornbos en zijn goede vriend Christijan Albers. Van Doornbos is die hoge klassering goed te verklaren: eind 2006 reed hij bij Red Bull Coulthard geregeld om de oren. Waarom de huidige werkgever van Verstappen niet verder met hem is gegaan, is me eerlijk gezegd een beetje een raadsel. Albers heeft zijn hoge positie vooral te danken aan het feit dat hij er met name in 2007, toen Sutil hem alle hoeken van de baan liet zien, een handje van had om zijn snelste tijd van het weekend in de vrije trainingen in plaats van de kwalificatie neer te zetten, waardoor die optredens buiten beschouwing zijn gelaten. Daar zit dus nog ruimte voor verbetering voor het model.

2019
Hoe staat het dan met 2019? Wat zijn de verwachtingen? Hieronder de verwachte kwalificatieduels per team:

Mercedes
Hamilton (2699) - Bottas (2564) 14-7, Hamilton gemiddeld 0,21% sneller

Ferrari
Vettel (2640) - Leclerc (2797) 6-15, Leclerc gemiddeld 0,24% sneller

Renault
Ricciardo (2660) - Hülkenberg (2635) 11-10, Ricciardo gemiddeld 0,04% sneller

Haas-Ferrari
Magnussen (2470) - Grosjean (2567) 8-13, Grosjean gemiddeld 0,15% sneller

Racing Point-Mercedes
Pérez (2564) - Stroll (1793) 21-0, Pérez gemiddeld 1,17% sneller

De andere teams hebben debutanten, waardoor er geen voorspelling is te maken. Volgens het model heeft Ferrari plotseling het beste rijderspaar in de kwalificatie. Als de rode bolides in 2019 net zo goed zijn als de afgelopen jaren, dan kan Hamilton zijn borst alvast natmaken. Verstappen zal naar verwachting sneller zijn dan Gasly, maar omdat Gasly's rating onbetrouwbaar is (hij heeft alleen Hartley als teamgenoot gehad), durf ik daar verder geen uitspraken over te doen. Ricciardo - Hülkenberg wordt heel interessant, terwijl Grosjean wordt geacht Magnussen te verslaan. Pérez zal in de kwalificatie naar verwachting geen enkele moeite hebben met Stroll.

zaterdag 5 januari 2019

Voorbeschouwing op 2019

2018 is voorbij en dat leek me een goede aanleiding om even stil te staan bij het komende Formule 1-seizoen. Wat zijn de grote veranderingen en wat kunnen we daarvan verwachten?

Aerodynamica
De belangrijkste verandering betreft de aerodynamica. Het voornaamste idee is om de voorvleugel te versimpelen, zodat de auto's elkaar in de race makkelijker kunnen volgen, wat tot meer inhaalacties zou moeten leiden. Is inhalen te moeilijk geworden? Wie zich de inhaalraces van Hamilton in Engeland en Duitsland van afgelopen jaar voor de geest haalt, of aan de manier waarop Verstappen in Rusland het middenveld in de openingsfase voor schut zette, zou denken van niet. Toch is het aantal inhaalacties de laatste jaren drastisch afgenomen.

Gemiddeld aantal inhaalacties per race van 2011 tot en met 2018 in droge races (geel) en zowel natte als droge races (blauw). Bron: Clip the Apex.
Sinds het begin van het Pirelli-tijdperk in 2011 tot en met 2015 is het aantal inhaalacties gehalveerd, voornamelijk omdat de teams de banden steeds beter gingen begrijpen (het kleiner wordende startveld zal ook wel iets hebben bijgedragen aan die trend). In 2016 zorgde een verandering in het bandenreglement (een derde bandencompound) voor een welkome trendbreuk. In 2017 zorgde de toegenomen rol van de aerodynamica (bredere auto's = meer vleugeloppervlak = meer vuile lucht) in combinatie met hardere banden voor een nieuw dieptepunt. Afgelopen jaar waren er weer wat meer inhaalacties te bewonderen.

Interessant genoeg werd er afgelopen jaar meer ingehaald dan in 2015, ondanks dat het inhalen toen makkelijker zou moeten zijn geweest. Er spelen dus meer factoren een rol, zoals de banden. Voor 2019 lijkt er aan het bandenfront weinig te gaan veranderen, afgezien van de naamsveranderingen van de compounds. Aankomend jaar dus geen verwarring meer of de ultrazachte band nou harder of zachter is dan de hyperzachte of de superzachte band. Het zal mij in ieder geval benieuwen of de aerodynamische veranderingen ook daadwerkelijk voor meer inhaalacties en interessantere races zorgen. Wat dat laatste betreft is het voorstel om DRS krachtiger te maken een slecht teken. DRS zorgt ongetwijfeld voor meer inhaalacties, maar ze worden er absoluut niet interessanter door.

Brandstof
Een kritiekpunt van de soms erg fragiele Pirelli-banden was dat de coureurs niet meer de hele race pushen. Hetzelfde geldt voor de brandstoflimiet waardoor de coureurs alleen maar bezig waren met brandstof sparen. In Amerika overschreed Magnussen zelfs de limiet van 105 kilogram brandstof voor de race, waardoor hij zonder pardon gediskwalificeerd werd. Als reactie daarop werd de limiet voor de tweede keer in twee jaar tijd verhoogd naar 110 kilogram (in 2017 werd de limiet al verhoogd van 100 naar 105 kilogram vanwege de breder geworden auto's). Het zou ervoor moeten zorgen dat de coureurs weer de hele race lang volle bak rijden in plaats van dat ze de hele tijd met een half oog de brandstofmeter in de gaten moeten houden. Een goed idee of symboolpolitiek?

Volgens de ingewijden is het vooral dat laatste, omdat het vaak sneller is om tijdens de race wat brandstof te sparen om zo met een iets lichtere auto aan de race te beginnen. Als vuistregel kan gesteld worden dat iedere extra kilogram brandstof in de race ongeveer een seconde kost. Stel dat een coureur aan 110 kilogram brandstof inderdaad genoeg heeft om de hele race voluit te rijden, dan verliest hij door zijn grotere brandstoflast bijvoorbeeld 10 seconden ten opzichte van een coureur die met slechts 100 kilogram brandstof van start gaat. Stel dat het in de race ook 10 seconden kost om het brandstofverbruik met 10 kilogram te verminderen (bijvoorbeeld door zuinigere motorinstellingen of het zogenaamde lift and coast, waarbij de coureur aan het eind van het rechte stuk het gas loslaat, wat brandstof spaart zonder dat de rondetijd al te zeer wordt beïnvloed), dan zijn beide strategieën even snel. De coureur die met weinig brandstof van start gaat is in het begin van de race sneller, terwijl de coureur die met meer brandstof van start gaat aan het eind sneller is.

Toch is er een manier om sneller te gaan door het beste van beide strategieën te combineren. Een coureur die in het begin van de race voluit gaat en later brandstof spaart, vermindert zijn gemiddelde brandstoflast in de race op een efficiënte manier; dat wil zeggen dat hij relatief lang kan pushen zonder dat zijn auto gemiddeld over de race veel zwaarder is. Hierdoor kan hij over een raceafstand een aantal (2½ in dit getallenvoorbeeld) seconden winnen:

Totaal tijdsverlies door brandstoflast en brandstof sparen in een race.
In het voorbeeld is het dus optimaal om met 105 kilogram brandstof van start te gaan en niet met de toegestane 110 kilogram. Hoewel de tijdswinsten maar gering zijn, zitten er nog andere voordelen aan het starten met een lichtere auto, namelijk een lager brandstofverbruik, minder bandenslijtage en een lagere belasting van de remmen. Daarnaast loopt een coureur die met veel brandstof is gestart het risico dat hij zijn brandstof niet meer krijgt opgebruikt na een lange neutralisatie. Aangezien elke ongebruikte druppel brandstof in de race niets anders dan ballast is, kost hem dat eveneens tijd.

Kortom: het lijkt erop dat er komend jaar waarschijnlijk niet veel zal veranderen. Misschien zal de verhoogde brandstoflimiet op een aantal circuits (vermoedelijk Circuit Gilles Villeneuve, Circuit of the Americas en Yas Marina Circuit) voor iets levendigere races zorgen, maar voor de overige circuits zal het niet veel uitmaken. Al met al zal het racebeeld in 2019 vermoedelijk niet veel verschillen van dat van 2018. Misschien zullen er iets meer DRS-inhaalacties zijn, maar grote veranderingen verwacht ik niet. Misschien zit ik er wel compleet naast. Wat denkt de lezer? Missen de reglementswijzigingen hun uitwerking niet, of gaat de Formule 1 op de oude voet verder?