Per poter seguire più agevolmente la trattazione si faccia riferimento al video allegato


Buone notizie per Kean: hanno trovato il fotogramma mancante!
Ieri siamo tornati a parlare di fuorigioco per via del gol annullato a Kean per una manciata di millimetri.
L'articolo ha avuto un discreto successo di letture, e questo mi ha indotto a riproporre anche gli altri articoli della trilogia del fotogramma mancante.
Per una comprensione più agevole vi consiglio di fare riferimento al video allegato. Buona lettura!

Nel video di qualche giorno fa, dedicato al fuorigioco, ci siamo soprattutto soffermati sul meccanismo che attualmente viene utilizzato per stabilire se un’azione debba essere interrotta o meno.
Considerando per ognuna delle fasi la situazione peggiore, concatenando quindi tutte le eventualità che mettono più in crisi il meccanismo attualmente utilizzato, il risultato è stato l’individuazione di una soglia di 44 cm, sicuramente molto “severa”. Essa però è stata scelta per dare certezze: ci dice che per valori di distanza tra le estremità di attaccante e difendente maggiori di 44 cm, il fuorigioco è indiscutibile, al-di-là-di-ogni-ragionevole-dubbio.
Essa discrimina i fuorigioco veri, da quelli ritenuti tali sulla base di una infallibilità solo illusoria, di una fiducia cieca nei confronti di un concetto quasi mistico di “tecnologia”. Il problema è che molti sembrano aver dimenticato (o forse non aver mai saputo) che ogni misura deve sempre, sempre, sempre essere accompagnata dall’informazione circa la precisione dello strumento con cui la si è misurata.
In questo studio abbiamo voluto considerare il tema del fuorigioco da un punto di vista completamente diverso, dove i numeri stavolta c'entrano poco, e più importanti sono i concetti.

Come abbiamo visto la volta scorsa, le telecamere usate per determinare la presenza del fuorigioco, devono avere caratteristiche eccezionali sia di risoluzione spaziale, sia temporale; con frequenze di campionamento dell’ordine dei 250 Hz, o, come i gamers preferiscono dire, 250 fps.
Nel meccanismo attuale la videocamera deve cercare di riprendere la sequenza degli avvenimenti con un dettaglio temporale sufficiente per determinare l’istante tc in cui la palla viene toccata dal piede. Con le attuali frequenze di campionamento abbiamo visto che la probabilità di riuscire a riprendere con un fotogramma l'istante "esatto" in cui la palla viene toccata dal piede è davvero molto bassa.

La domanda che oggi mi pongo, e che pongo anche al lettore è: ma è davvero così importante che la videocamera generi un frame “esattamente” nell'istante in cui la palla viene toccata? Intanto ci sarebbe già da contestare il concetto di “esattamente”. Non è un caso, infatti, che siano state usate le virgolette. Noi abbiamo una successione di punti che NON è fitta a sufficienza per determinare a quale di essi corrisponda l'istante che ci interessa.
Non dico però nulla di trascendentale né di particolarmente innovativo, se faccio presente che esistono decine di algoritmi matematici computazionalmente molto leggeri, quindi adattissimi ad essere utilizzati anche in tempo reale, per ricostruire mediante interpolazioni la posizione dei punti intermedi. A pensarci bene, a confermare la validità dell’idea, viene in soccorso il noto teorema del campionamento, che, detto in termini semplici, afferma che dato un segnale x(t), è possibile ricostruirlo in modo esatto a partire da suoi campioni, a patto che essi siano sufficientemente fitti. E’ il principio di funzionamento dei CD, al cui interno non c’è altro che una successione fittissima (44100 al secondo) di campioni, di “fotografie” del suono.

Per dare dimostrazione della fattibilità pratica ho sviluppato un’app che gira in ambiente Windows che implementa un algoritmo basato sulla teoria matematica delle B-Spline per calcolare i frame mancanti. Esso parte da una successione di vertici (i punti che descrivono le posizioni di piede e palla, campionati dalla telecamera ad alta risoluzione ed alta velocità), ed è in grado di generare due nuove successioni di punti, fitte a piacere, che ricostruiscono gli andamenti nel tempo delle posizioni di piede e palla, permettendo quindi di stimare con la massima precisione l’istante esatto tc in cui avviene il contatto tra piede e palla.

Avrete già capito l'utilità di tutto ciò: tramite l'algoritmo che ho implementato (ma qualsiasi altro sarebbe andato altrettanto bene) è possibile determinare con esattezza l'istante di contatto, e, badate bene, l'esattezza stavolta è reale, non fittizia. Essa infatti sta nel fatto che posso scegliere un numero di punti intermedi grande a piacere, quindi con una precisione limitata solo dalla potenza computazionale del PC; a sua volta, in un certo senso, considerabile priva di limiti.
Una volta stabilito con precisione infinita l'istante tc in cui c'è il tocco della palla, possiamo (sempre costruendo le B-Spline che descrivono fittamente le posizioni relative di attaccante e difendente) determinare altrettanto precisamente la posizione relativa dei giocatori, sia essa in termini di luce, o di centri geometrici, opzione che io continuo a ritenere la migliore, in quanto associata a movimenti molto più lenti e regolari degli oggetti della misura.

A Corollario di queste poche righe, aggiungo una considerazione che sembra prendere spunto dal principio di indeterminazione di Heisenberg, il quale, semplificando, afferma che è impossibile misurare con precisione infinita sia la posizione, sia anche la velocità di una particella: più è grande la precisione di una misura, meno buona sarà la precisione dell'altra. Non dovendoci più preoccupare troppo di avere una frequenza di campionamento eccezionale, bensì solo molto buona, sarebbe possibile spostare la nostra attenzione sulla scelta di videocamere che garantiscano un'ottima qualità delle immagini anche in scarse condizioni di visibilità, e soprattutto su risoluzioni ancora più spinte, in modo che, una volta individuato l'istante esatto del contatto piede-palla, esse possono garantire in ogni occasione una precisione della misura davvero dell'ordine del centimetro.
A proposito… precisione reale, non fittizia!
Curve che descrivono, anch’esse con una loro frequenza di campionamento tutt’altro che infinita, le posizioni lungo l’asse y (asse longitudinale) dei due giocatori, anche in questo caso possono essere infittite a piacimento mediante il medesimo algoritmo di generazione di B-Spline, brevemente descritto prima, da incrociare con il tempo di contatto, tc prima ricavato possono anch’esse essere infittite a piacimento mediante le B-Spline.

Conclusioni 2.0

  1. L’esigenza di individuare, tra i fotogrammi generati dalla videocamera, quello che più si avvicina all’istante effettivo di contatto tra piede e palla, accettando che nel caso peggiore tale fotogramma sia lontano da quell’istante ben 4 ms, con conseguenti enormi imprecisioni nello stabilire la reale, effettiva posizione reciproca di attaccante e difendente è potenzialmente superabile. E questo già oggi, senza l’introduzione di nessun ausilio hardware aggiuntivo.
  2. I fotogrammi vengono ripresi con una frequenza di campionamento insufficiente per sperare che tra essi ce ne sia sempre uno “abbastanza vicino” all’evento piede-tocca-palla, ma decisamente sovrabbondante per permettere ad un qualsiasi algoritmo interpolatore di ricostruire senza nessuna perdita di informazione tutta la sequenza del “film”
  3. Questa sovrabbondanza del numero di frame potrebbe consentirci di spostare la nostra attenzione verso videocamere anche più lente, ma che garantiscano migliore qualità in termini di nitidezza anche in contesti di illuminazione sfavorevoli, e migliore risoluzione, per alimentare gli algoritmi di ricostruzione dell’interazione palla-piede con dati più precisi e per determinare in modo più preciso l’ampiezza del fuorigioco, una volta noto l’istante esatto in cui tale verifica deve essere fatta.