Il calcio non è una scienza esatta. Sicuri?
Così i big data possono sostituirsi agli osservatori L'analisi dei dati delle performance calcistiche di PlayeRank e come si sta evolvendo il mondo del pallone
Quando anni fa volevamo spiegare l'imponderabilità del calcio, dicevamo “non è una scienza esatta” e la discussione era chiusa. Ora, invece, il rischio che una mano si alzi e qualcuno chieda di parlare per confutare la frase è abbastanza alta. Comincia a essere una scienza. Certo, resta la possibilità del tocco di un campione, del rimbalzo irregolare, ma sul fato nessuno può intervenire. E – si dirà – nemmeno sulla grandezza del talento. Invece sul talento sì. O meglio: siamo sempre più vicini alla possibilità che un giocatore non abbia più segreti, che di lui si sappia praticamente tutto, come si muove, da dove tira, dove lo si può aggredire per renderlo meno efficace. Perché nel pallone mondiale c'è Cristiano Ronaldo, certo, di cui siamo più che informati, forse abbiamo visto ogni sua partita e, con un minimo di occhio, ci siamo fatti un'idea, sapremmo descriverlo (fermarlo rimane difficile, ma questo è un altro discorso). Il punto, però, è un altro e va oltre Cristiano Ronaldo: è possibile sapere tutto di tutti?
La risposta potrebbe essere PlayeRank, una delle ultime invenzioni nel velocissimo mondo dei big data applicati al calcio; una startup che ha poco più di un anno di vita e che è stata fondata da ricercatori dell’Università di Pisa e del CNR di Pisa, specializzati nell'analisi dei dati di performance calcistiche. A rendere preziosa la novità ci sono un algoritmo sofisticato e l'intelligenza artificiale, i veri nuovi strumenti di scouting che portano il calcio nel futuro. Alla base ci sono una montagna di dati, forniti grazie a una partnership scientifica e commerciale da Wyscout, l'azienda italiana di scouting e match analysis, che segue migliaia di partite in tutto il mondo e produce numeri e video che, finora, erano poi analizzati da un occhio umano che sapeva pescare nel database. Qui il passo è in avanti: PlayeRank fa “vedere” le partite all'intelligenza artificiale, che ne ricava informazioni sulle performance dei calciatori secondo le istruzioni che vengono date. In particolare ogni partita viene considerata, mettendo insieme contatti, tocchi, contrasti e tiri, zone del campo in cui l'azione si svolge e momenti della partita, come un insieme di circa 3.000 “eventi”, ognuno dei quali ha un impatto sulla gara e, in base a questo, un punteggio. Da qui l'intelligenza artificiale tira fuori un ranking, che permette di stilare una graduatoria di calciatori per ogni zona del campo, ma anche di tracciare i progressi del giocatore stesso, di conservare la serie per capire quando si tratta di qualcuno in crescita tecnica e quali siano le proprie potenzialità, prima degli altri. Quando, ad esempio, l'Atalanta prese dalla Svezia un giovanissimo Dejan Kulusevsky, la struttura di PlayeRank arrivò subito alla conclusione che potesse trattarsi di un giocatore già pronto per la Serie A, e il fatto che quest'anno, appena diciannovenne, sia titolare nel Parma ne è una conferma. Così come sono tutti pronti a scommettere sulle potenzialità di Sebastiano Esposito, diciassettenne dell'Inter che improvvisamente Antonio Conte ha deciso di lanciare come possibile star. Tutto questo senza che nessuno dei fondatori e soci della startup abbia mai visto una partita.
“Questo grafico contiene tutti gli eventi registrati per un singolo giocatore durante una partita. Nello specifico, abbiamo plottato i dati di Messi durante un Barça-Real di qualche anno fa” spiega Paolo Cintia
“Noi – dice Paolo Cintia, amministratore delegato della PlayeRank – è come se giocassimo a Fifa, ma senza schermo. Quello che facciamo è allenare l'intelligenza artificiale perché segua le partite per noi, secondo le nostre indicazioni. E poi ci restituisca dei dati scientifici”. Questi dati sono l'impatto di un giocatore nella partita, anche: i numeri non si contano, in questo studio, ma si pesano. Così se si cerca un giocatore da acquistare basta lanciare quella che in informatica si chiama query e chiedere nella zona che si ritiene scoperta chi è il giocatore migliore, ottenere una graduatoria e provare a comprare quello che è più alla portata di un club. O se si vuol sapere come fermare un avversario, quali sono i suoi punti di forza e anche quali sono i suoi atteggiamenti in campo basta chiedere tutte le informazioni che l'intelligenza artificiale può tirare fuori.
Nell'era dei match analyst in ogni squadra, diventati professionisti indispensabili per ogni settore tecnico perché interpretano, meglio, con più precisione e meno soggettività quello che una volta era il ruolo degli osservatori, adesso c'è un metodo molto più veloce e ancora meno fallibile per sapere tutto quello che serve. E anche tuffarsi nel calciomercato somiglia a una seduta di borsa, in cui si può vedere l'andamento di un giocatore come fosse un titolo, e scegliere quando investire.
Questo contiene i "ruoli" dei calciatori calcolati dall'algoritmo in base alle posizioni medie di tutti i calciatori in tutte le partite. Ogni punto è appunto una posizione media di un calciatore registrato durante una partita. Il "nuvolone" contiene tutti i principali campionati europei (7 campionati) per due stagioni, spiega Paolo Cintia
Le prime collaborazioni, con Barcellona, Roma, Inter e Ferencváros, hanno fatto capire che c'è spazio per approfondire ancora lo studio del pallone, mentre si pensa ai passi successivi. Andare avanti, per PlayeRank, è innanzitutto (il passo più prossimo) avere la capacità di analizzare anche i dati delle performance e dello sforzo in allenamento. Un modo scientifico per valutare il carico di lavoro su un singolo giocatore e aiutare nella gestione e nella prevenzione degli infortuni nel modo più preciso possibile, mettendo insieme valori e serie storiche del calciatore con un metodo molto più efficace del più evoluto di quelli attuali. Poi si proverà ad arrivare a implementare le capacità predittive dell'intelligenza artificiale, in modo che non solo dica se un giocatore è in crescita negli anni e di quanto, ma anche fino a che punto quel calciatore può arrivare.
Prima che i nostalgici si mettano a lottare con una tesi che non piace, ma che non conoscono, meglio sapere che PlayeRank è spesso in giro per far conoscere il proprio metodo. Era a Trento, al Festival dello Sport, nei giorni scorsi e sarà alla Fiera di Roma in questo weekend, nel corso del Maker Faire, la fiera dell'innovazione in programma fino a domenica. Anche i più scettici potranno accedere al dataset che, con i dati di cinque campionati a disposizione, renderà possibile per ognuno personalizzare l'analisi delle performance. E sarà più difficile troncare una discussione dicendo che il calcio non è una scienza esatta, perché forse non è più così.