El algoritmo de la UEFA: señal y ruido
Hace menos de una semana, hablábamos de Big Data en el fútbol en una jornada organizada por Footters en Sevilla. El martes había jugado España su primer partido en la Eurocopa y posteriormente la UEFA publicó su primer once ideal. Andrés Iniesta había sido declarado MVP del partido, pero la UEFA no lo incluyó en el equipo titular europeo.
Esto no fue objeto de disertación ni discusión en la jornada de Sevilla, el hecho pasó desapercibido, seguramente porque aún no se había relacionado con la intervención de un algoritmo.
Ahora, después del gran partido de España ante Turquía, en el que Iniesta volvió a sobresalir y a ser declarado MVP, el algoritmo está siendo objeto de todo tipo de chanzas.
Y, efectivamente, hay motivo. Cuando la mayoría de los expertos y observadores parecen de acuerdo en una altísima valoración del desempeño de este jugador en el comienzo del torneo, el algoritmo lo descarta. Al mismo tiempo, jugadores con una actuación muy discreta, si no claramente decepcionante, como Cristiano Ronaldo, forman parte de los elegidos.
No es posible, sin conocer al menos los criterios principales del algoritmo, afirmar tajantemente ni que está equivocado ni explicar claramente por qué. Ahora bien, podemos conjeturar que si tenemos dos jugadores, uno de los cuales despliega una actuación sobresaliente, sin que en su puesto haya otra actuación equivalente, quedando el otro, en cambio, marcado por una actuación mediocre, y el primero no es seleccionado y el segundo sí, esto sólo puede suceder porque otros datos han tenido más peso.
Ahora bien, si se trata de seleccionar al once de la Eurocopa, ¿puede haber otros datos más relevantes para elegirlo? Esto apunta a uno de los riesgos más claros y más ignorados en Big Data. En las grandes masas de datos hay señal, pero hay mucho más ruido que señal y si no separamos la señal (datos pertinentes para nuestro propósito), el ruido nos confunde… Lo que no quiere decir que logre achicar la figura de un futbolista como Andrés Iniesta.