lunes, 2 de noviembre de 2020

La revolución de las matemáticas llega al fútbol

Imagen de la información sobre un jugador ofrecida por el programa estadístico Wyscout, uno de los más importantes del fútbol profesional

“El fútbol es así” es la excusa habitual cuando un jugador no sabe explicar por qué un partido ha ido mal. Es la admisión de que el fútbol es artesano, antiguo, lleno de azar. Es un deporte que no puede razonarse. Pero cada vez será menos así. Como en el resto de deportes, la ciencia ha empezado a colonizar las decisiones de entrenadores, directivos y secretarios técnicos. 

José Luis Mendoza, director de Relaciones Institucionales del UCAM Murcia, equipo de la Segunda B, tenía un problema con el lenguaje de sus ojeadores. Cuando le recomendaban un posible fichaje le decían cosas así: “Este tío es bueno porque va fuerte a la disputa, pasa bien y tiene visión de juego”. A Mendoza la explicación le parecía poco convincente. Su ojeador insistía: “Viene de este equipo y ya ha logrado todo esto”. Mendoza seguía esperando un razonamiento distinto: “Yo quiero oír algo así: Este tío es bueno porque, uno, tiene un porcentaje de acierto en pase corto del 80%, que está por encima de la media en la liga. Dos, genera tres ocasiones de gol de pase final, varios puntos por encima de la media”.

Mendoza fue a la Universidad de Berkeley en 2009. Allí vio que la estadística -habitual en béisbol, baloncesto y fútbol americano- iba a alcanzar al fútbol. Unos años después de volver a España, buscaba un método parecido para el UCAM. No encontró nada, hasta esta temporada. Fue de la mano de otros dos españoles que habían emigrado a Estados Unidos. David Rueda vive desde hace 7 años en Florida. Desde allí ha fundado Origami Sports. Su misión es dar a la estadística un lugar central en la toma de decisiones en los clubes: “Hasta ahora se toman decisiones multimillonarias basadas en las percepciones subjetivas de una o varias personas”, dice Rueda. El analista de Origami es Salvador Carmona, un joven de 27 años licenciado en Económicas con especialidad en estadística por la Universidad de Arizona. Carmona maneja una base de datos con 12.500 jugadores de las principales ligas del mundo. Los datos que tiene de cada uno no son solo los goles, minutos jugados y disparos. Son números más finos: pases completados, ocasiones creadas, pases entre líneas, regates o veces regateado. De ahí salen detalles como que un jugador “promedió tres regates por 90 minutos de juego, lo que le sitúan en el top 1% de jugadores de toda Sudamérica” o que “promedia más de 13 pases completados de más de 35 metros por partido”. Carmona puede pedirle a su base de datos que le diga qué jugadores tienen unos rasgos determinados. En los resultados saldrán jugadores que los ojeadores tradicionales no han visto nunca. Origami tiene de momento clientes en la liga española, la Serie A italiana y la Premier inglesa.

En la actualidad, el análisis detallado de las estadísticas futbolísticas para convertirlas en información que facilite la toma de decisiones, más conocido como "Big data", está en boca de todos. ¿Es posible convertir a un equipo modesto en campeón de liga con ayuda de los datos? ¿Se encontrará al próximo Messi a través del Big Data?, son solo algunas de las preguntas que más surgen en torno a esta novedosa herramienta.

Aún así, sigue habiendo entrenadores bastante reacios a emplear esta metodología y prefieren tomar sus decisiones basándose en sus intuiciones y conocimientos. Pero cada vez quedan menos. Es cierto que es imposible predecir a jugadores de la calidad de Leo Messi, pero no es menos cierto que gracias al Big data podemos obtener valiosa información para intentar frenarle: por dónde se mueve, dónde recibe, desde dónde y hacia que lado dispara, por qué lado suele salir en los regates...

De esta forma, analizando al equipo en conjunto, se pueden obtener datos de efectividad según la zona del campo por la que se ataque o el modo de juego empleado. Un único partido supone entre 10.000 y 12.000 líneas de código, la clave es conseguir filtrar lo relevante. Si cruzamos estos datos con los del equipo rival, podemos tener una idea de por dónde atacar para crear más peligro (llegando incluso a predecir la cantidad de duelos ganados de un jugador con respecto a otro), en qué zonas hay más probabilidad de ganar los duelos aéreos o dónde presionar al equipo rival para tener más opciones de robar el balón.
Imagen: Objetivo analista
Cómo se valora un delantero.
Un delantero no debería medirse solo por sus goles sino por sus “goles esperados”. Es una métrica que depende de la velocidad de la jugada -una jugada normal va a 2,5 metros por segundo-, el lugar desde el que se chuta o la parte del cuerpo. Cuanto más bajo es el coeficiente de un “gol esperado”, más mérito tiene el jugador por haberlo metido. Un penalti tiene un 0,81 de probabilidad de ser gol, un remate a puerta vacía a un metro de la línea de gol supera el 0,9. Si un delantero mete un porcentaje alto de sus “goles esperados” y encima son goles difíciles, será mejor. Ocurre igual con las asistencias. Un jugador que da el último pase depende de tener un buen delantero que lo meta para que cuente como asistencia. Con la variable “ocasiones creadas”, ese detalle pierde importancia. 

Esta finura en el tratamiento de datos permite definir con más precisión a cualquier jugador. Los fichajes hoy dependen de los ojeadores de un equipo: “El proceso natural es seguir muchos partidos durante la temporada. Se siguen las competiciones de primera, segunda A y B y algunas extranjeras”, dice Ramon Planes, secretario técnico del F.C. Barcelona. Por muchos jugadores que vean, ningún ojeador va a ser capaz de analizar todo lo que hacen los 22 jugadores en un campo en cada partido. Los datos, sí. “Esta tarde he estado viendo jugadores sub 23 de la segunda portuguesa, de la primera eslovaca y de la liga noruega”, dice Mendoza, del UCAM. “Son jugadores que están por encima del rendimiento de su liga y quería ver por qué”. Los ojeadores tradicionales del UCAM nunca habrían llegado a ese grado de detalle. Ahora un equipo puede pescar lejos y a jugadores más convenientes. Eso tiene una ventaja obvia -el rendimiento inmediato- y otra quizá más interesante: fichar barato y vender caro. 

Los ingenieros del éxito.
La revolución matemática ya tiene sus historias de éxito. En España, todos los amantes del fútbol recordamos los cuartos de final del mundial de Sudáfrica ante Paraguay. Iker Casillas siempre ha defendido que no es muy amigo de los datos, sino que se basa más en su intuición personal. Sin embargo, Pepe Reina había hecho los deberes ese día y sabía hacia dónde solía tirar Cardozo los penaltis en los momentos de tensión. Hay que añadir que, además, esa temporada ambos jugadores se habían cruzado en dos encuentros en Champions League y Cardozo le había lanzado dos penaltis a Reina por el mismo lado. Gracias a ambas cosas, en aquellos cuartos de final Reina aconsejó a Casillas tirarse hacia su izquierda y el resultado todos lo conocemos.

El Leicester, el Seattle Sounders y el Midtylland -campeones de las ligas inglesa, norteamericana y danesa- han usado este tipo de métodos para formar sus equipos. El uso de estadística en los entrenamientos y en el análisis del rival viene siendo algo más común, pero en la captación de jugadores es más innovador: “Mirar datos analíticos para buscar jugadores es común”, dice Brian Clarhaut, segundo entrenador del Nyköping BIS sueco y uno de los dos únicos norteamericanos que entrena en Europa. “Lo que no es común es hacer que los datos te den una lista inicial de jugadores. Eso es aún nuevo y revolucionario”, añade. Las agencias de jugadores también ven los beneficios de mejores datos: “Si tienes un extremo que quiere más dinero, debes mirar más allá de sus goles y asistencias: precisión en los desplazamientos, ocasiones creadas. Hay que contar su historia en números”, dice Remy Cherin, agente la norteamericana Remington Ellis Management. 

El Sevilla es quizá el club que mejor ha fichado en España los últimos años. Su dirección deportiva tiene a 16 empleados, que tienen asignadas ligas, las siguen y destacan a jugadores puntuales. Con esa información, hacen una lista: “Entre los 100 centrales que pueden venir al Sevilla, hemos visto a 99 y los técnicos dicen que 20 de esos pueden jugar en el primer equipo. Ese primer filtro es subjetivo”, dice Jesús Olivera, analista de la dirección deportiva. Esa lista se pasa al director deportivo, Monchi, y a sus ayudantes y “deciden que hay 10 elegidos”, dice Olivera. “Entonces es cuando empiezas a ir al detalle con estadísticas porque si intentas ver el detalle de los 100 te puedes volver loco”, dice Olivera. 

El Sevilla usa datos estadísticos como filtro final. Olivera sabe que hay modelos que pueden perfeccionar todo el proceso, y no solo mirar 100 sino 1.000 o 10.000, pero aún no lo hacen: “Que haya programas estadísticos que tengan sensibilidad para el juego es complicado”, dice, pero admite que el futuro va en esa dirección: “El big data es denso, requiere más trabajo porque tienes que guardar el equilibrio entre la ingeniería informática y el deporte”. Por ahora, el Sevilla no tiene ningún ingeniero ni economista en la secretaría técnica. Olivera no descarta que llegue alguno pronto. 

Los Seattle Sounders tienen a su ingeniero desde 2013. Ravi Ramineni es el jefe de analítica de datos del equipo tras pasar 6 años en Microsoft. Cuando llegó era un bicho raro. Tuvo que ganarse confianza con sus datos. “A menudo oía cómo alguien recordaba un golazo o un error terrible de un jugador y decía a continuación ‘creo que X es un buen finalizador y por eso es mejor que Y’”, cuenta. Ramineni hacía entonces lo que cualquier estadístico: mirar los datos y no fiarse de sus impresiones. “Entonces es cuando me decían ‘oh guau, vale’ y me preguntaban por mis métricas”. Que los Seattle Sounders hayan ganado la MSL no es casualidad. Su rival en la final, el Toronto FC, también había invertido en un equipo propio de analítica, según Ramineni. “Llevo tres años en el club y el último es el que más hemos usado los datos”, dice. Los Sounders no toman sus decisiones basados solo en datos, pero “cuando hay datos, no tomamos ninguna decisión sin mirarlos”, dice. 
 
La falta de confianza en los datos en fútbol es admisible. No son fáciles de recoger. Opta es la empresa de referencia en recogida de datos. El método es una evolución informática de los tradicionales palotes para contabilizar jugadas: “Cogemos todas las acciones con balón: sabemos quién lo toca, dónde y cuándo. Podemos decir cuántas veces ha tocado el balón un jugador, con qué parte del cuerpo, dónde y en qué segundo”, dice Chechu Fernández, director de producción de Opta. El instante en que lo toca es importante, por ejemplo, porque permite calcular la velocidad de una jugada. Opta tiene estos datos de 20 ligas en el mundo. También hay empresas -las dos principales son Instat o Wyscout- que recortan los vídeos de miles de partidos para poder reunir todos los regates o contraataques de un solo jugador. Este método es prodigioso y requiere de un entrenamiento especial para los empleados que introducen los datos en directo. Pero para Ramineni “es muy primitivo”. “Veo el fútbol como un juego donde se manipula el espacio a través del movimiento sin balón”, añade. Para que los datos sean útiles, Ramineni aspira a tener la posición exacta de los 22 jugadores en cada segundo del partido. Entonces, cree, llegará la revolución verdadera de los datos. 

La importancia de la colocación 
Saber la colocación de todos los jugadores puede parecer excesivo, pero no lo es. Matthew Benham, propietario del inglés Brentford y del danés Midtjylland, que ha hecho su fortuna con modelos estadísticos en una casa de apuestas, contó este caso en la conferencia Matchbook Traders de 2015: “Un jugador puede ser bueno en robos y tackles [entradas] pero quizá es más vistoso que otro en quien no te fijas porque es más sigiloso que quienes van con todo. Por otro lado, ¿está el jugador haciendo muchas entradas porque está mal colocado?” 

La estadística llega tarde al fútbol no solo porque sea un deporte conservador con poca confianza en los datos. También porque hay retos difíciles de solucionar respecto a otros deportes. Hay causas evidentes: los pies son menos fiables que las manos. “Las acciones con las manos son más reproducibles porque su precisión es mayor que la de los pies”, dice Rafa Monfort, ojeador de Udinese y Watford. Los creadores de Opta, por ejemplo, fueron dos especialistas en balonmano. Hay al menos otros dos motivos: uno, la combinación permanente de 11 jugadores. Uno de los mayores retos de los analistas es definir la aportación de un jugador a su equipo y cuál sería su rendimiento con otros 10 compañeros. Dos, la poca cantidad total de datos respecto a otros deportes. “La media de goles por partido es de 2,5-2,7 en todo el mundo, 22-27 tiros a puerta y hay muchos menos partidos que en el béisbol o en la NBA”, dice Ramineni. 

La mayor ventaja de la estadística no es su fiabilidad o innovación, sino que viene a colaborar con una máquina imperfecta: el ser humano. La psicología lleva décadas definiendo la irracionalidad humana en la toma de decisiones. Hay prejuicios científicamente establecidos. Un ojeador que ha sido futbolista cree que su experiencia es típica y por lo tanto busca ejemplos similares. Cuando nos convencemos de algo -de que un jugador es el adecuado o de que no lo es-, es más probable que busquemos razones para seguir convencidos. Cuando hemos comprado -o fichado- algo, por malo que sea, de repente es mejor que lo que no hemos comprado y buscamos razones que lo certifiquen. Pocos creen que en el fútbol los modelos estadísticos reemplacen todo juicio humano en la captación de jugadores. Tal y como dice Ted Knutson, co-fundador de StatsBomb: “La cantidad de dinero invertida en fichajes es bestial, por lo que adelantarse a un mal fichaje y pararlo, pagará al equipo de análisis durante años

Un claro ejemplo es el de Nolito, por aquel entonces en su primera etapa en Celta de Vigo, y que fue pretendido por el Barcelona en el mercado de invierno. Esto hizo que el conjunto vigués buscase un sustituto ante su más que posible salida. La mejor alternativa que llegó a las oficinas del club fue la de Sofiane Boufal, en ese momento un joven desconocido del Lille francés. Según los datos que tenían, los dos jugadores poseían unas características similares y fijaron el precio de su incorporación en unos cuatro millones de euros. Finalmente, Nolito no llegó a marcharse en ese mercado de invierno y Bouffal terminó en el siguiente mercado de fichajes en el Southampton por 19 millones de euros, cifra 5 veces superior a su valor real y que acabó siendo ruinosa para el equipo inglés.

Eso sí, que nadie piense que la estadística eliminará en su totalidad los fichajes erráticos porque el rendimiento de un jugador en otra ciudad o país depende de muchos factores -que también pueden tenerse en cuenta en los cálculos. La mejora de los modelos estadísticos es una labor permanente y en constante evolución, ya que siempre habrá una pregunta nueva que hacerse. Eso sí, la respuesta, al menos, ya no podrá ser esa de que “el fútbol es así”.

- ¿Crees que el big data puede ser de utilidad al deporte o crees que es una moda?
- ¿Crees que podría aplicarse a todos los deportes?
- ¿Basarías tus decisiones en el big data o te dejarías guiar más por tu experiencia e intuición? Justifica tu respuesta

Fuentes: Merkle y El País

No hay comentarios:

Publicar un comentario