Soms moet je naar een sessie gaan die je gewoon leuk lijkt. Je haalt er altijd wel wat uit. Zo ook met "The data science of moneybaling motorsports". In het panel 2 data mensen, 1 teamleider van Indycar, en Bruno Senna, neefje van Ayrton, die een uitgebreide carriere in de autsport heeft gehad. Het panel is unaniem Alonso fan, bleek.
Data in racing
Wat betekent "Moneyballing in motorsports"? Er zijn 2 grote manieren om data te gebruiken a la moneyball (een data-gedreven benadering van sport, beroemd gemaakt door boek van Michael Lewis en later een film).
1. Hoe vergelijk je rijders objectief? Hoe vind je talent? Hoe kan je de kracht en zwaktes van individuele rijders vinden?
2. Hoe optimaliseer je de race strategie? Wat moet je doen als er grote kans op een gele vlag is, hoe optimaliseer je pitstops, wat doen tegenstanders, dat soort zaken.
Opvallend is dat het panel zegt dat autosporten achter lopen ten opzichte van wat zij de "ball and stick" sporten noemen. Waarom is dat?
- Er zijn heel veel variabelen in racen. Een sport als honkbal is relatief eenvoudig, met een voorspelbare en vrij elementaire basis: Een pitch en een slag. In autosport heb je te maken met de rijder, de auto, de baan, andere rijders, omstandigheden, en is het nooit hetzelfde
- Data is niet zo beschikbaar voor autosport. Dat vond ik een opvallende uitspraak, want een team genereert toch terabytes in een weekend? Het verschil zit niet in het volume maar in de dekking van de data. Honkbal heeft honderden wedstrijden per jaar, autosport enige tientallen. Leuke take away: Veel data is niet altijd nuttige data.
- Data verjaart. Omdat de regels vaak veranderen (andere banden, auto's, aero, andere regels) heb je niet zo veel aan data van een paar jaar geleden.
Kansen voor data en AI
AI wordt gezien als kans. Momenteel is het vooral een big data verhaal, en zit het werk nog in het bruikbaar en 'actionable' maken van die data om beslissingen mee te nemen. Er worden voorafgaand aan races miljoenen simulaties gemaakt om het verloop te voorspellen en scenario's te bepalen. Maar dit is pre-race; tijdens de race zijn er nog geen mogelijkheden om snel een voorspelling te doen: Wat moeten we nu doen, nu er geel is in sector 3 en er 20% kans op regen. Real time AI zou hier een doorbraak kunnen zijn. Hoewel het menselijke aspect hier natuurlijk ook de kleur geeft aan de sport.
En, half grappend, AI zou ook bruikbaar zijn om het regelboek te analyseren en te vinden waar de loopholes zitten.
Toekomst van AI in racing
Als AI meer wordt gebruikt in de toekomst ziet Senna dat het racen closer gaat worden. De pre-race strategie kan dan in de race worden aangepast. En de data scientist in het panel ziet ook kansen voor reinforcement learning: Laat de computer eindeloos met de simulator rijden, zodat je exact de limiet van de auto leert kennen. Soortgelijk aan het zeilverhaal van team New Zealand bij SXSW 2021. Er is in ieder geval genoeg te doen, en veel teams zitten te springen om data talent. Wellicht niet in F1, maar er zijn talloze klassen waar je aan de slag kan als data scientist. Op de vraag vanuit het publiek "How can I get started as data scientist" was in ieder geval het antwoord "Do you have a card?"