Son los datos, estúpido

Son los datos, estúpido.
Retransmisión de la épica final de Nadal con un 4% de opciones

Durante la campaña en la que Clinton ganó las elecciones a Bush parece ser que contra todo pronóstico, un asesor de Clinton había pegado la frase «Es la economía, estúpido», junto con otras dos, en la pared para recordarle al candidato el asunto clave para ganar aquellos comicios. Hoy me he acordado de dicha frase y me ha salido del alma «Son los datos, estúpido», cuando he empezado a leer en linkedin decenas de críticas a un algoritmo matemático que durante la retransmisión del partido de Nadal, con el 2-0 en contra, daba una probabilidad de ganar a Rafa del 4% (como puede verse en la foto). Mucha gente afirma que el algoritmo se equivocó, que no calculó bien y que tenemos que tener cuidado de dejar en manos de los algoritmos ciertas decisiones. Ellos CREEN que las probabilidades eran más altas. Que existía el factor Nadal y ese algoritmo es erróneo. Por cierto, hoy da más datos sobre el algoritmo y la empresa que lo calcula un periódico. Vayamos por partes.

La impresionante victoria de Nadal.

Soy aficionado al tenis desde pequeñito aunque no lo he practicado nunca como federado. Lo de ayer, desde un punto de vista de aficionado fue espectacular, brutal, maravillosa y todos los adjetivos que se le quieran poner. Impresionante su increíble capacidad para no venirse abajo con el 2-0 en contra, para no dejarse llevar con todo lo que ha venido sufrendo, para remangarse y punto a punto dar la vuelta a un partido que para mucho estaba ya casi perdido.

Antes de empezar el partido, el algoritmo daba un 64% de posibilidades de victoria a Medvedev y un 36% a Nadal. Casualmente (o no) el monitor de tenis de mi hijo hizo una precición muy similar el viernes por la noche cuando ya se conocían los finalistas. «Opciones hay, pero favorito es el ruso. 60-40». La máquina, conforme avanza el pártido, lo único que hace es incorporar datos a su análisis. Ojo, seguramente una cantidad de datos que no somos capaces de imaginar: el resultado, sí, pero también el porcentaje de primeros y segundos servicios, los golpes ganadores, los errores no forzados, el uso de la derecha y del revés, los giros de la bola en el efecto, los datos históricos de remontada…

Con el 2-0 a favor del ruso, la máquina dice 96% vs 4%. Y quizás le estaba dando más posibilidades a Rafa que muchos aficionados al tenis. ¿Qué significa eso? Que si se siguieran jugando 100 partidos desde es instante, en 96 ocasiones ganaría el ruso y en 4 ganaría Rafa. Y tuvimos la inmensa suerte de poder ver una de esas veces. La máquina dijo que era poco probable, no que fuera imposible.

La remontada ya lo he dicho, fue épica, maravillosa, brutal, incréible, espectacular… No hay palabras. De hecho, cuanto menor hubiera sido la probabilidad que le dé la máquina, mayor sería la épica del momento. De hecho si lo más normal del mundo fuera pasar de un 2-0 a un 2-3, entonces no habría que ponerle tantos adjetivos, porque hubiera sido un día más en la oficina.

Un antecedente tenístico y algunos comentarios.

Antecedentes de remontada hay muchos y casos extremos también. En 1995, en Roland Garros, Jana Novotna, 5ª favorita, ganaba en el tercer set a Chanda Rubin, 53 del mundo, 5-0 y 0-40 a su favor. Tres bolas consecutivas de partido. La máquina hubiera dicho, posiblemente y aproximadamente, que sólo había un 1% de posibilidades de levantar aquel partido. Quizás un uno por mil. Chanda Rubin ganó 8-6 levantando 9 bolas de partido. Excepcional, por supuesto. Pero la máquina habría dicho lo que todos habríamos pensado en aquel momento, tal y cómo lo hizo ayer.

Hace unos años, antes de Internet, uno de los pocos deportes donde se podía apostar con el juego empezado era la pelota vasca. Los corredores (de apuestas) adaptaban sus posturas en función de como iba el partido. Ayer probablemente con el 2-0 hubieran estado muy aburridos (y se hubieran ido animando posteriormente). Imagino que ayer, en las casa de apuestas, que basan las recompensas en función de datos, la remontada de Nadal se pagaba cara. Y si tu tuvieses que tomar una decisión de apostar… lo racional no hubiera sido hacerlo a favor de Nadal. Ahora seguro que mucha gente dice que lo habría hecho, quizas si el dinero te sobra igual hubieras apostado algo de dinero por el milagro. Pero… ¿hubieras apostado tu casa a la remontada de Nadal?

Pero es que «YO CREO QUE» o «A MI SE ME HACE QUE».

Leyendo los comentarios «contra» el algoritmo matemático me encantan los que señalan que «Yo creo que ese porcentaje era muy bajo» o no se tuvo en cuenta el «factor Nadal para las remontadas». Yo personalmente no he visto el algoritmo y seguramente no lo entendería si me dejaran leer el código, pero no me atrevería a ponerlo en duda sobre mis supuestos y creencias y mi opinión personal acerca del gran jugador que es Nadal. No voy a dejar que la CREORÍA gane a la EVIDENCIA. Yo soy de la opinión de que «Son los datos, estúpido».

Unos pocos datos. En los últimos tres años (2019-2021), en el circuito ATP se han disputado 1395 partidos a 5 sets. Se completaron 1347 (por tema de lesiones, descalificaciones, etc…). De esos, 878 empezaron 2-0 a favor de uno de los contendientes y sólo 54 se remontaron, lo que hace un 6,15% (estoy haciendo 54 sobre 878, la probabilidad de ver una remontada así en un partido a 5 sets es de 54 sobre 1357). De esas 54 remontadas, sólo 4 fueron remontadas a un Top 10 y sólo en dos ganó el de menor ranking. Andujar (68) a Thiem (4) en primera ronda de Roland Garros del 21 y Tsitsipas (6) a Nadal (2) en cuartos el año pasado en Australia. Por cierto… cuando se trataba de una final, siempre había ganado el del mejor ranking: Djokovic (1) a Tsitsipas (5) el año pasado en Roland Garros y Thiem (4) a Zverev (7) en la final del US Open del 20. Ya sólo con eso y sin contar con la lesión y la inactividad de Rafa y la racha del ruso podríamos estar en el 4%… o menos. Pero a pesar de esto alguno seguirá creyendo que

Son los datos, y lo sabes.

¿Y si nos vamos a tu empresa? ¿Tomarías tus decisiones en base a datos, en base a la opinión de expertos o en base a opiniones no contrastadas? ¿Qué es lo que da relevancia a una opinión? Las opiniones son como los culos, todo el mundo tiene uno. Y yo puedo dejar que todo el mundo haga sus aportaciones y proponga ideas. Pero una aportación, sin datos, es sólo una opinión más. De hecho, personalmente, considero que la opinión del monitor de tenis de mi hijo es más fundada que la mía porque considero que sus conocimientos (y al final eso son datos e información) son mayores que los míos. Del mismo modo que mi opinión sobre lo que pasaba con el volcán de la palma es igual de válida que la de un médico de urgencias metido a comentarista televisivo porque los dos posiblemente tengamos el mismo conocimiento de volcanes (lo que leímos la semana anterior en prensa). Ah, nuestra opinión en cualquier caso debería valer una mierda respecto a la de un verdadero vulcanólogo. Pero ya sabemos que en este país, cuando cruzamos la puerta del bar, a todos nos dan el Título de Doctor en lo que haga falta.

Concluyendo… Es normal que las decisiones en tu empresa (y muchas en tu vida) se tomen en base a datos y no a opiniones del primero que pasa por la puerta. Eso es lo que ahora se llaman las empresas data-driven. Ojo, es cierto que a veces se le da un peso a la intuición a la hora de tomar decisiones, pero esa intuición se basa en la experiencia y el conocimiento de alguien que lo tiene, que lo ha vivido. Y posiblemente, en ese caso, lo que habían dicho los números es que no sabían si irse para un lado o para el otro. Por mucho que ahora digas que tu lo sabías, no, no te habrías apostado ayer tu casa a favor de la victoria de Nadal. ¿O si?

Deja una respuesta

Tu dirección de correo electrónico no será publicada.