@Vdot_Spain: Se acaban las ligas, llega el ...
@Vdot_Spain
17 views
May 13, 2024
1
Se acaban las ligas, llega el verano y con ello los fichajes. Llegan las Fake Metrics al fútbol
Hoy vengo a hablar de las fake metrics un término que ni mucho menos he inventado yo pero que si que creo que hay analizarlo con algo de calma por el bien de nuestra profesión.
¿Pero qué es esto de las fake metrics?
Pues simplemente métricas, que si bien son reales, existen, están ahí, aportan poco valor y/o nula contextualización. Es decir números que dicho sin más “No sirven para nada”.
Acompáñame en este (triste) hilo...
Hoy vengo a hablar de las fake metrics un término que ni mucho menos he inventado yo pero que si que creo que hay analizarlo con algo de calma por el bien de nuestra profesión.
¿Pero qué es esto de las fake metrics?
Pues simplemente métricas, que si bien son reales, existen, están ahí, aportan poco valor y/o nula contextualización. Es decir números que dicho sin más “No sirven para nada”.
Acompáñame en este (triste) hilo...
2
¿Por qué es importante hablar de ellas?
Porque desde mi opinión las fake metrics inundan y colapsan la información y los datos en el fútbol. Pero cuidado, la llegada y el uso de estas fake metrics no tienen un “componente malévolo” como sus primas las fake news que quieren sobre todo manipular una opinión, si no que tienen varios trasfondos que creo que son importantes al menos conocer.
Porque desde mi opinión las fake metrics inundan y colapsan la información y los datos en el fútbol. Pero cuidado, la llegada y el uso de estas fake metrics no tienen un “componente malévolo” como sus primas las fake news que quieren sobre todo manipular una opinión, si no que tienen varios trasfondos que creo que son importantes al menos conocer.
3
¿Por qué se usan?
Por dos motivos:
1⃣ El primer motivo no es más que el acceso a información irrelevante. Como todos sabéis tenemos varios tipos de datos. Un ejemplo son los agregados por temporada y a a veces por partido.
De fácil acceso en webs gratuitas o de pago muy económico en algunos proveedores. Y es esta la que la mayoría analiza, y que para mi en la mayoría de las ocasiones son irrelevantes, y no porque sean mentira, si no porque saber cuantos pases da un jugador no nos aporta ningún tipo de información sin conocer ¿desde dónde, adónde, a quién, bajo qué situación, qué paso antes, y después, volvió a participar en la secuencia, es lo que le pedimos al jugador, qué tiene que hacer, etc…? Pero no puedo juzgar a quien los use, por desgracia yo también los tengo que usar con algunos clientes, porque querer llegar más lejos requiere de una inversión que no todos pueden asumir. Pero es importante como consultor avisar de los riesgos de usar la información así.
Por dos motivos:
1⃣ El primer motivo no es más que el acceso a información irrelevante. Como todos sabéis tenemos varios tipos de datos. Un ejemplo son los agregados por temporada y a a veces por partido.
De fácil acceso en webs gratuitas o de pago muy económico en algunos proveedores. Y es esta la que la mayoría analiza, y que para mi en la mayoría de las ocasiones son irrelevantes, y no porque sean mentira, si no porque saber cuantos pases da un jugador no nos aporta ningún tipo de información sin conocer ¿desde dónde, adónde, a quién, bajo qué situación, qué paso antes, y después, volvió a participar en la secuencia, es lo que le pedimos al jugador, qué tiene que hacer, etc…? Pero no puedo juzgar a quien los use, por desgracia yo también los tengo que usar con algunos clientes, porque querer llegar más lejos requiere de una inversión que no todos pueden asumir. Pero es importante como consultor avisar de los riesgos de usar la información así.
4
2⃣El segundo motivo es para mí más preocupante. Es la necesidad humana de hacer complejo lo sencillo con un fin personal de parecer que somos más “listos” que el de al lado. ¿Pero de qué hablas Jesús? Menudo jardín.
¿Por qué nos empeñamos en crear métricas tan dificil de explicar? O mejor aún, ¿por qué no explicamos de manera sencilla las métricas complejas? Porque pierden todo tipo de valor. Veamos un ejemplo: Los famosos xT, VAEP, OBV, g+, etc basados en el eventing (ojo con esto, no es lo mismo basado en el tracking pero creo que tampoco se irá muy lejos). Si vemos la fórmula del xT la mayoría no seríais capaces de descifrar cada componente. Hay una probabilidad de tiro, el xG asociado a ese tiro, una probabilidad de pase, una iteración a diferentes celdas, los xT asociados a cada uno de ellas con sus probabilidades de pase y tiro y xG, etc.
¿Por qué nos empeñamos en crear métricas tan dificil de explicar? O mejor aún, ¿por qué no explicamos de manera sencilla las métricas complejas? Porque pierden todo tipo de valor. Veamos un ejemplo: Los famosos xT, VAEP, OBV, g+, etc basados en el eventing (ojo con esto, no es lo mismo basado en el tracking pero creo que tampoco se irá muy lejos). Si vemos la fórmula del xT la mayoría no seríais capaces de descifrar cada componente. Hay una probabilidad de tiro, el xG asociado a ese tiro, una probabilidad de pase, una iteración a diferentes celdas, los xT asociados a cada uno de ellas con sus probabilidades de pase y tiro y xG, etc.
5
Así que vemos que al final todo depende del xG, y ¿de qué depende el xG en casi su totalidad? De la distancia a la portería.
Entonces ¿qué medimos con el xT y este tipo de métricas?
La capacidad de acercar el balón a la portería rival. ¿No me creeis? Mirad la imagen, vemos el xT asociado en cada celda, y por tanto el xT de una acción será restar la celda 2 - celda 1.
Entonces ¿qué medimos con el xT y este tipo de métricas?
La capacidad de acercar el balón a la portería rival. ¿No me creeis? Mirad la imagen, vemos el xT asociado en cada celda, y por tanto el xT de una acción será restar la celda 2 - celda 1.
6
¿A qué ya no es tan glamuroso?
Imagina que le cuentas esto a un entrenador o a un director deportivo, ¿tanta fórmula para esto? Efectivamente.
Y es que no es solo eso, vamos a hacer un ejemplo. Mirad la imagen. Tenemos un jugador en banda derecha, en ese momento tiene que tomar una decisión, ¿centrar al área o circular? Su xT inicial es 0,021 porque históricamente la probabilidad de tirar de ahí y su xG es casi nula y la de pasar a cada zona del campo normalmente será centro al área. Si centra al área y nuestro delantero remata (línea verde) hablamos que el centro ha creado un 0.332-0.021=0.311xT lo cual es muchísimo por cierto. Pero ya sabemos que rematar ahí es complejo, además como no usamos el tracking no sabemos si el área esta cargada de defensores, dónde está el portero, etc…
Imagina que le cuentas esto a un entrenador o a un director deportivo, ¿tanta fórmula para esto? Efectivamente.
Y es que no es solo eso, vamos a hacer un ejemplo. Mirad la imagen. Tenemos un jugador en banda derecha, en ese momento tiene que tomar una decisión, ¿centrar al área o circular? Su xT inicial es 0,021 porque históricamente la probabilidad de tirar de ahí y su xG es casi nula y la de pasar a cada zona del campo normalmente será centro al área. Si centra al área y nuestro delantero remata (línea verde) hablamos que el centro ha creado un 0.332-0.021=0.311xT lo cual es muchísimo por cierto. Pero ya sabemos que rematar ahí es complejo, además como no usamos el tracking no sabemos si el área esta cargada de defensores, dónde está el portero, etc…
7
En cambio nuestro jugador toma otra decisión y es que el balón no ha llegado allí para ser centrado, si no que hemos cargado el lado fuerte del rival para descargar rápidamente el lado débil en el carril izquierdo, y con una circulación rápida poder conseguir una ventaja numérica con un 2x1. Pero fijaos los números. Es que esa acción es negativa! ¿por qué? si es una jugada muy buena! porque no se acerca a porteria históricamente. Si hiciesemos un modelo solo con datos del Barcelona y City posiblemente ese xT sería diferente, pero no, usamos los datos de toda una liga.
En resumen, una métrica que aporta poco valor dado que podemos saber lo que se acerca el balón a la portería rival sin necesidad de fórmulas complejas y sin contextualizar principios de juego básicos y encima “negativizandolos”.
En resumen, una métrica que aporta poco valor dado que podemos saber lo que se acerca el balón a la portería rival sin necesidad de fórmulas complejas y sin contextualizar principios de juego básicos y encima “negativizandolos”.
8
Ahora, también os digo, si queréis ir a un Forum a hablar de esto, escribir un paper o yo que sé, pues ideal, pero como os sentéis con un entrenador o un director deportivo, lo tenemos crudo.
9
Así que ¿por qué no preguntamos a los que necesitan a los jugadores qué quieren? ¿Qué necesitan? Lo primero de lo primero, preguntar.
Imaginad que nos sentamos con el entrenador y nos dice “Quiero un 9”. Y yo trabajar en la NASA.
¿Qué es un 9 para ti? ¿Qué le vas a exigir? ¿Qué tiene que hacer en el terreno de juego? ¿Además de marcar goles que aunque sea el de los “cheettos” hasta ahí llego?
Así que coge su pizarra y nos lo explica:
La imagen de Bilardo no es baladí, cualquier entrenador te lo va a explicar a su manera, en tu tejado está entenderlo. Tienes que entender su idioma (no tienes porque hablarlo) pero si entenderlo, y traducirlo en datos. Y el 90% de las veces con datos agregados no podrás explicar lo que necesita el entrenador. Con el eventing podrás llegar a un 70-75% y con el tracking más, ahora, pide precio por el tracking, no solo del dato, a todo lo anterior, sumale el precio de una persona que sepa de todo esto. No son 1000€, ya te lo digo yo.
Imaginad que nos sentamos con el entrenador y nos dice “Quiero un 9”. Y yo trabajar en la NASA.
¿Qué es un 9 para ti? ¿Qué le vas a exigir? ¿Qué tiene que hacer en el terreno de juego? ¿Además de marcar goles que aunque sea el de los “cheettos” hasta ahí llego?
Así que coge su pizarra y nos lo explica:
La imagen de Bilardo no es baladí, cualquier entrenador te lo va a explicar a su manera, en tu tejado está entenderlo. Tienes que entender su idioma (no tienes porque hablarlo) pero si entenderlo, y traducirlo en datos. Y el 90% de las veces con datos agregados no podrás explicar lo que necesita el entrenador. Con el eventing podrás llegar a un 70-75% y con el tracking más, ahora, pide precio por el tracking, no solo del dato, a todo lo anterior, sumale el precio de una persona que sepa de todo esto. No son 1000€, ya te lo digo yo.
10
Bueno, nuestro entrenador y/o analistas de juego nos dan un chorro de explicaciones y hasta videos (basado en hechos reales no os penséis que os cuento esto porque me lo dijo un amigo de un amigo...) y te das cuenta que lo quiere es un 9 que desayune tibias de centrales, que sea capaz de jugar de espaldas y descargar salidas en largo, dar apoyo en salida a los centrales cayendo incluso campo propio para descargar sobre carriles, capaz de combinar rápido con extremos por dentro o interiores, vamos un Mitrovic o un Toney (sin apostar) de toda la vida. ¿Y por qué este tipo de jugador? Me han pedido un listado de jugadores, no un análisis de situación (esto es otro tema más complejo, que es llevarle la contraria al DD y entrenador).
11
Así que cogemos el eventing, que un equipo profesional si puede pagar o al menos debe, construimos las secuencias, analizamos los eventos y los cualificadores como por ejemplo recibir un pase dentro del área y devolver al mismo jugador siendo tu pase bajo presión (implica que hay una fijación o un salto de un central) y que el jugador que recibe nuestro pase ha ganado X metros y recibe sin presión (si pasa o tira sin presión o no tiene que realizar regate). Así podemos “intuir” una fijación con pase y una ventaja espacial provocada por nuestro 9. En imagen sería así e indicamos un listado de jugadores en la liga de referencia para ver que esos son los jugadores que “buscamos” Fijaos que pone 42. Hay 41 métricas antes explicadas.
12
Y cuando ya tenemos todas las métricas analizadas podemos buscar al jugador que más hace, o por z-score, etc. Yo en este caso prefiero hablar de jugador “capaz” Analizar por ejemplo no todos los partidos, si no en cuantos partidos por ejemplo hizó lo que pediamos, o contra ciertos rivales, o según el resultado, etc. Y fijaos, ni fórmulas mágicas ni nada raro, solo intentar traducir las necesidades de un entrenador en números.
Y por cierto, al final lo que importa es el listado, validado con liga referencia y acompañado de un video de cada jugador que el entrenador “vea” que no le tomamos el pelo.
Y por cierto, al final lo que importa es el listado, validado con liga referencia y acompañado de un video de cada jugador que el entrenador “vea” que no le tomamos el pelo.
13
¿Y cómo lo veo yo?
Pues "malamente". Creo que las fake metrics han venido para quedarse, yo reconozco que de ese carro me bajé, creo en otra metodología de trabajo, en otra manera de entender el dato y el fútbol, pero no me hagáis caso, es una guerra que doy perdida y ahora viene el momento de aguantar. Seguir profundizando en la relación juego y datos y huir de hiperparametrización de modelos.
Pues "malamente". Creo que las fake metrics han venido para quedarse, yo reconozco que de ese carro me bajé, creo en otra metodología de trabajo, en otra manera de entender el dato y el fútbol, pero no me hagáis caso, es una guerra que doy perdida y ahora viene el momento de aguantar. Seguir profundizando en la relación juego y datos y huir de hiperparametrización de modelos.







