No es ningún milagro que, en el largo transcurrir del tiempo, mientras Fortuna sigue su curso acá y acullá, hayan de ocurrir espontáneamente numerosas coincidencias.
Plutarco
«Tú también eres Capricornio. ¡Qué emoción!».
Un hombre que viajaba mucho estaba preocupado por la posibilidad de que hubiera una bomba en su avión. Calculó la probabilidad de que fuera así y, aunque esta era baja, no lo era lo suficiente para dejarlo tranquilo. Desde entonces lleva siempre una bomba en la maleta. Según él, la probabilidad de que haya dos bombas a bordo es infinitesimal.
Algunos cumpleaños y un cumpleaños determinado
Sigmund Freud señaló en cierta ocasión que las coincidencias no existen. Carl Jung habló de los misterios de la sincronización. Y en general la gente habla de ironías por aquí e ironías por allá. Tanto si las llamamos coincidencias, sincronizaciones o ironías, resulta que son mucho más frecuentes que lo que la gente cree.
He aquí algunos ejemplos representativos: «¡Oh! Pues mi cuñado fue también a esa escuela, el hijo de mi amigo le cuida el césped al director, y además la hija de mi vecino conoce a una chica que había sido jefa de animadoras del equipo de la escuela». «La idea de pez ha salido en cinco ocasiones desde que ella me ha confesado esta mañana que le asustaba pescar en medio del lago. Pescado para comer, el motivo de los peces del vestido de Carolina, el…». Cristóbal Colón descubrió el Nuevo Mundo en 1492 y su compatriota Enrico Fermi descubrió el nuevo mundo del átomo en 1942. «Primero dijiste que querías seguirle la corriente a él, pero luego dijiste que querías seguirle la corriente a ella. Está clarísimo lo que te pasa». La razón entre las alturas de los edificios Sears de Chicago y Woolworth de Nueva York coincide en lo que respecta a las cuatro primeras cifras (1,816 frente a 1.816) con la razón entre las masas del protón y el electrón. Reagan y Gorbachov firmaron el tratado INF el 8 de diciembre de 1987, exactamente siete años después de que John Lennon fuera asesinado.
Una de las principales características de las personas anuméricas es la tendencia a sobrestimar la frecuencia de las coincidencias. Generalmente dan mucha importancia a todo tipo de correspondencias, y, en cambio, dan muy poca a evidencias estadísticas menos relumbrantes, pero absolutamente concluyentes. Si adivinan el pensamiento de otra persona, o tienen un sueño que parece que ha ocurrido, o leen que, pongamos por caso, la secretaria del presidente Kennedy se llamaba Lincoln y que la del presidente Lincoln se llamaba Kennedy, lo consideran una prueba de cierta armonía maravillosa y misteriosa que rige de algún modo su universo personal. Pocas experiencias me descorazonan más que encontrarme con alguien que parece inteligente y abierto, que de pronto me pregunta por mi signo del zodíaco y que luego empieza a encontrar características de mi personalidad que encajan en ese signo (independientemente de qué signo le haya dicho yo).
El siguiente resultado, bien conocido en probabilidad, es una buena ilustración de la sorprendente probabilidad de las coincidencias. Como el año tiene 366 días (incluimos el 29 de febrero), tendríamos que reunir 367 personas para estar seguros de que por lo menos dos personas del grupo han nacido el mismo día. ¿Por qué?
Ahora bien, ¿qué pasa si nos contentamos con tener una certeza de sólo el 50%? ¿Cuántas personas habrá de tener el grupo para que la probabilidad de que por lo menos dos de ellas hayan nacido el mismo día sea una mitad? A primera vista uno diría que 183, la mitad de 366. La respuesta sorprendente es que sólo hacen falta veintitrés. En otras palabras, exactamente la mitad de las veces que se reúnen veintitrés personas elegidas al azar, dos o más de ellas han nacido el mismo día.
Para aquellos lectores que no se acaban de creer el resultado, he aquí una breve deducción. Según la regla del producto, cinco fechas distintas se pueden elegir de (365 × 365 × 365 × 365 × 365) maneras distintas (si se permiten las repeticiones). De estos 3655 casos, en sólo 365 × 364 × 363 × 362 × 361 ocurre que no hay dos fechas repetidas; se puede escoger en primer lugar cualquiera de los 365 días, cualquiera de los 364 restantes en segundo, y así sucesivamente. Así pues, dividiendo este último producto (365 × 364 × 363 × 362 × 361) entre 3655, tendremos la probabilidad de que cinco personas escogidas al azar no celebren el cumpleaños el mismo día. Y si restamos esta probabilidad de 1 (o del 100% si trabajamos con porcentajes), tendremos la probabilidad complementaria de que al menos dos de las cinco personas hayan nacido el mismo día. Un cálculo análogo, tomando 23 en vez de 5, da 1/2, el 50% para la probabilidad de que por lo menos dos personas de entre 23 celebren el cumpleaños el mismo día.
Hace un par de años alguien trataba de explicar esto en el programa de Johnny Carson. Este no lo creyó y, como entre el público del estudio había unas 120 personas, preguntó cuántas de ellas habían nacido el mismo día, pongamos el 19 de marzo. Nadie se levantó y el invitado, que no era matemático, adujo algo incomprensible en su defensa. Lo que tendría que haber dicho es que hacen falta veintitrés personas para tener una certeza del 50% de que un par de ellas comparten algún cumpleaños, no uno concreto como el 19 de marzo. Se necesita un grupo mayor, 253 personas para ser exactos, para tener una seguridad del 50% de que una de ellas celebre su cumpleaños el 19 de marzo.
Vamos a deducir esto último en unas pocas líneas. Como la probabilidad de que uno no haya nacido el 19 de marzo es 364/365, y como los cumpleaños son independientes, la probabilidad de que dos personas no hayan nacido el 19 de marzo es 364/365 × 364/365. Y la probabilidad de que N personas no celebren el cumpleaños en este día es (364/365)N, lo que para N = 253 da aproximadamente 1/2. Por tanto, la probabilidad complementaria de que por lo menos una de estas 253 personas haya nacido el 19 de marzo es también 1/2, o el 50%.
La moraleja vuelve a ser que mientras es probable que ocurra algún hecho improbable, lo es mucho menos que se dé un caso concreto. El divulgador matemático Martin Gardner ilustra la distinción entre acontecimientos genéricos y acontecimientos concretos por medio de una ruleta con las veintiséis letras del alfabeto. Si se la hace girar cien veces y se apunta la letra que sale cada vez, la probabilidad de que salga la palabra GATO o FRÍO es muy baja, pero la probabilidad de que salga alguna palabra es ciertamente alta. Como ya he sacado a colación el tema de la astrología, el ejemplo de Gardner aplicado a las iniciales de los meses del año y de los planetas viene particularmente a cuento. Los meses EFMAMJJASOND nos dan JASON, y con los planetas MVTMJSUNP tenemos SUN. ¿Tiene esto alguna trascendencia? En absoluto.
La conclusión paradójica es que sería muy improbable que los casos improbables no ocurrieran. Si no se concreta con precisión cuál es el acontecimiento a predecir, puede ocurrir un suceso de tipo genérico de muchísimas maneras distintas.
En el próximo capítulo hablaremos de los curanderos y de los televangelistas, pero ahora viene a cuento observar que sus predicciones suelen ser lo suficientemente vagas como para que la probabilidad de que se produzca un hecho del tipo predicho sea muy alta. Son las predicciones concretas las que raramente se hacen realidad. Que un político de fama nacional vaya a someterse a una operación de cambio de sexo, como predecía recientemente una revista de astrología y parapsicología, es considerablemente más probable que el hecho de que este político sea precisamente Koch, el alcalde de Nueva York. Que algún telespectador sane de su dolor de estómago porque un predicador televisivo atraiga los síntomas es considerablemente más probable que el hecho de que esto le ocurra a un espectador determinado. Análogamente, las políticas de seguros de amplia cobertura, que compensan cualquier accidente, suelen ser a la larga más baratas que los seguros para una enfermedad o un accidente concretos.
Encuentros fortuitos
Dos extraños, procedentes de puntos opuestos de los Estados Unidos, se sientan juntos en un viaje de negocios a Milwaukee y descubren que la mujer de uno de ellos estuvo en un campo de tenis que dirigía un conocido del otro. Esta clase de coincidencias es sorprendentemente corriente. Si suponemos que cada uno de los aproximadamente 200 millones de adultos que viven en los Estados Unidos conoce a unas 1.500 personas, las cuales están razonablemente dispersas por todo el país, entonces la probabilidad de que cada dos tengan un conocido en común es del uno por ciento, y la de que estén unidos por una cadena con dos intermediarios es mayor que el noventa y nueve por ciento.
Podemos entonces estar prácticamente seguros, si aceptamos estas suposiciones, de que dos personas escogidas al azar, como los extraños del viaje de negocios, estarán unidos por una cadena de dos intermediarios como mucho. Que durante su conversación pasen lista de las 1.500 personas que conoce cada uno (así como de los conocidos de estas), y así sean conscientes de la relación y de los dos intermediarios, es ya un asunto más dudoso.
Las suposiciones en que basamos la deducción anterior se pueden relajar un tanto. Quizás el adulto medio conozca menos de 1.500 personas o, lo que es más probable, la mayoría de la gente que conoce vive cerca y no está dispersa por todo el país. Incluso en este caso, menos favorable, es inesperadamente alta la probabilidad de que dos personas escogidas al azar estén unidas por una cadena de como mucho dos intermediarios.
El psicólogo Stanley Milgrim emprendió un enfoque más empírico del problema de los encuentros fortuitos. Tomó un grupo de personas escogidas al azar, dio un documento a cada miembro del grupo y le asignó un «individuo destinatario» al que tenía que transmitir el documento. Las instrucciones eran que cada persona tenía que mandar el documento a aquel de sus conocidos que más probablemente conociera al destinatario, instruyéndole para que hiciera lo mismo, hasta que el documento llegara a su destino. Milgrim encontró que el número de intermediarios iba de dos a diez, siendo cinco el número más frecuente. Aunque menos espectacular que el argumento probabilístico anterior, el resultado de Milgrim es más impresionante. Aporta bastante a la explicación de cómo las informaciones confidenciales, los rumores y los chistes corren tan rápidamente entre cierta población.
Si el destinatario es un personaje conocido, el número de intermediarios es aún menor, sobre todo si uno está relacionado con uno o dos personajes célebres. ¿Cuántos intermediarios hay entre tú y el presidente Reagan? Pongamos que sean N. Entonces el número de intermediarios entre tú y el secretario general Gorbachov es menor o igual que (N + 1), pues Reagan y Gorbachov se conocen. ¿Cuántos intermediarios hay entre tú y Elvis Presley? Aquí tampoco pueden ser más de (N + 2), pues Reagan conoce a Nixon y este conoció a Presley. La mayoría de las personas se sorprenden al darse cuenta de lo corta que es la cadena que les une a cualquier personaje célebre.
Cuando era estudiante de primer año de universidad escribí una carta al filósofo y matemático inglés Bertrand Russell, en la que le contaba que había sido uno de mis ídolos desde el bachillerato y le preguntaba sobre algo que él había escrito referente a la teoría de la lógica del filósofo alemán Hegel. Además de contestarme, incluyó la respuesta en su autobiografía, entre cartas a Nehru, Jruschov, T. S. Eliot, D. H. Lawrence, Ludwig Wittgenstein y otras lumbreras. Me gusta decir que el número de intermediarios que me relaciona con esas figuras históricas es una: Russell.
Otro problema de probabilidad sirve para ilustrar lo corrientes que pueden llegar a ser las coincidencias en otro contexto. El problema se formula a menudo como sigue: un número grande de hombres dejan sus sombreros en el guardarropa de un restaurante y el encargado baraja inmediatamente los números de orden de los sombreros. ¿Cuál es la probabilidad de que, a la salida, por lo menos uno de los hombres recupere su propio sombrero? Lo natural es pensar que, al tratarse de un número grande de hombres, la probabilidad ha de ser muy pequeña. Sorprendentemente, el 63 por ciento de las veces por lo menos uno de los clientes recuperará su sombrero.
Planteémoslo de otro modo: si barajamos mil sobres con las direcciones escritas en ellos y mil cartas con las mismas direcciones también, y luego metemos cada carta en un sobre, la probabilidad de que por lo menos una carta vaya en el sobre que le corresponde es también del 63 por ciento. O bien tómense dos mazos de cartas completamente barajadas y puestas boca abajo. Si vamos destapando las cartas de dos en dos, una de cada mazo, ¿cuál es la probabilidad de que el par de cartas coincida por lo menos una vez? El 63 por ciento también. (Pregunta al margen: ¿Por qué sólo hace falta barajar completamente uno de los mazos?).
El ejemplo del cartero que ha de distribuir veintiuna cartas entre veinte buzones nos permitirá ilustrar un principio numérico que a veces sirve para explicar la certeza de un determinado tipo de coincidencias. Como 21 es mayor que 20, puede estar seguro, sin necesidad de mirar previamente las direcciones, que por lo menos uno de los buzones tendrá más de una carta. Este principio de sentido común, que se conoce a veces como principio del casillero o de los cajones de Dirichlet, puede servir a veces para llegar a conclusiones que no son tan obvias.
Ya lo hemos empleado más arriba al afirmar que si tenemos 367 personas juntas podemos estar seguros de que por lo menos dos de ellas han nacido en el mismo día del año. Más interesante es el hecho de que, de entre los habitantes de Filadelfia, hay por lo menos dos con el mismo número de cabellos. Consideremos todos los números hasta 500.000, cantidad que se toma generalmente como cota superior del número de cabellos de una persona, e imaginemos que numeramos medio millón de buzones con dichos números. Imaginemos también que cada uno de los 2,2 millones de habitantes de Filadelfia es una carta que hay que depositar en el buzón numerado con el número de cabellos de esa persona. Así, si el alcalde Wilson Goode tiene 223.569 cabellos, será depositado en el buzón correspondiente a dicho número.
Como 2.200.000 es considerablemente mayor que 500.000, podemos estar seguros de que por lo menos dos personas tienen el mismo número de cabellos; esto es, que alguno de los buzones recibirá por lo menos dos habitantes de Filadelfia. (De hecho, podemos estar seguros de que por lo menos cinco habitantes de Filadelfia tienen el mismo número de cabellos. ¿Por qué?).
Un timo bursátil
Los asesores de bolsa están en todas partes y es muy probable encontrar alguno que diga cualquier cosa que uno esté dispuesto a oír. Normalmente son enérgicos, parecen muy expertos y hablan una extraña jerga de opciones de compra y de venta, cupones de cero y cosas por el estilo. A la luz de mi humilde experiencia, la mayoría no tiene mucha idea de lo que está hablando, pero cabe esperar que algunos sí.
Si durante seis semanas seguidas recibieras por correo las predicciones de un asesor de bolsa acerca de cierto índice del mercado de valores y las seis fueran acertadas, ¿estarías dispuesto a pagar por recibir la séptima predicción? Supón que estás realmente interesado en hacer una inversión y también que te han planteado la pregunta antes de la crisis del 19 de octubre de 1987. Si estuvieras dispuesto a pagar por esa predicción (y si no, también), piensa en el siguiente timo.
Uno que se hace pasar por asesor financiero imprime un logotipo en papel de lujo y envía 32.000 cartas a otros tantos inversores potenciales en un cierto valor de la bolsa. Las cartas hablan del elaborado sistema informático de su compañía, de su experiencia financiera y de sus contactos. En 16.000 de las cartas predice que las acciones subirán y, en las otras 16.000, que bajarán. Tanto si suben las acciones como si bajan, envía una segunda carta pero sólo a las 16.000 personas que recibieron la «predicción» correcta. En 8.000 de ellas, se predice un alza para la semana siguiente, y en las 8.000 restantes, una caída. Ocurra lo que ocurra, 8.000 personas habrán recibido ya dos predicciones acertadas. Manda una tercera tanda de cartas, ahora sólo a estas 8.000 personas, con una nueva predicción de la evolución del valor para la semana siguiente: 4.000 predicen un alza y 4.000 una caída. Pase lo que pase, 4.000 personas habrán recibido tres predicciones acertadas seguidas.
Sigue así unas cuantas veces más, hasta que 500 personas han recibido seis «predicciones» correctas seguidas. En la siguiente carta se les recuerda esto y se les dice que para seguir recibiendo una información tan valiosa por séptima vez habrán de aportar 500 dólares. Si todos pagan, nuestro asesor les saca 250.000 dólares. Si se hace esto a sabiendas y con intención de defraudar, es un timo ilegal. Y sin embargo, se acepta si lo hacen involuntariamente unos editores serios pero ignorantes de boletines informativos sobre la bolsa, los curanderos o los televangelistas. El puro azar siempre deja lugar a una cantidad suficiente de aciertos que permiten justificar casi cualquier cosa a alguien predispuesto a creer.
Un problema totalmente distinto es el que tiene como ejemplo los pronósticos bursátiles y las explicaciones fantásticas del éxito en la bolsa. Como sus formatos son muy variados y a menudo resultan incomparables y muy numerosos, la gente no puede seguirlos todos. Generalmente, aquellas personas que prueban suerte y no les sale bien no airean su experiencia. Pero siempre hay algunas personas a las que les va muy bien. Estas harán una sonora propaganda de la eficacia del sistema que han seguido, sea cual fuere este. Otros harán pronto lo mismo y nacerá una moda pasajera que medrará durante una temporada a pesar de carecer de fundamento.
Hay una tendencia general muy fuerte a olvidar los fracasos y concentrarse en los éxitos y los aciertos. Los casinos abonan esta tendencia haciendo que cada vez que alguien gana un cuarto de dólar en una máquina tragaperras, parpadeen las lucecitas y la moneda tintinee en la bandeja de metal. Con tanta lucecita y tanto tintineo, no es difícil llegar a creer que todo el mundo está ganando. Las pérdidas y los fracasos son silenciosos. Lo mismo vale para los tan cacareados éxitos financieros frente a los que se arruinan de manera relativamente silenciosa jugando a la bolsa, y también para el curandero que gana fama con cualquier mejoría fortuita, pero niega cualquier responsabilidad si, por ejemplo, atiende a un ciego y este se queda cojo.
Este fenómeno de filtrado está muy extendido y se manifiesta de muchas maneras distintas. Para casi cualquier magnitud que uno elija, el valor medio de una gran colección de medidas es aproximadamente el mismo que el valor medio de un pequeño conjunto, y en cambio el valor extremo de un conjunto grande es considerablemente más extremo que el de una colección pequeña. Por ejemplo, el nivel medio de agua de cierto río tomado sobre un período de veinticinco años es, aproximadamente, el mismo que el nivel medio en un período de un año, pero seguro que la peor riada habida en el intervalo de veinticinco años será más intensa que la que haya habido en el período de un año. El científico medio de la pequeña Bélgica será comparable al científico medio de los Estados Unidos, aún cuando el mejor científico norteamericano será, en general, mejor que el belga (aquí no hemos tenido en cuenta factores que evidentemente complican el problema, como tampoco cuestiones de definición).
¿Y qué? Como la gente sólo suele prestar atención a los vencedores y a los casos extremos, ya sea en deportes, artes o ciencias, siempre hay una tendencia a denigrar a las figuras de hoy en día, tanto deportivas como artísticas o científicas, comparándolas con los casos extraordinarios. Una consecuencia de ello es que las noticias internacionales acostumbran a ser peores que las nacionales, que a su vez son peores que las estatales, las cuales son, por la misma regla, peores que las locales, que en última instancia son peores que las del entorno particular de cada uno. Los supervivientes locales de la tragedia acaban invariablemente diciendo en televisión algo así como: «No puedo entenderlo. Nunca había ocurrido nada parecido por aquí».
Y una opinión para acabar. Antes de la radio, la televisión y el cine, los músicos, los atletas, etcétera, podían hacerse un público local de leales, pues eran lo mejor que la mayoría de esas personas iba a ver en su vida. Los públicos de ahora nunca quedan satisfechos de las figuras locales, ni siquiera en las zonas rurales, y exigen talentos de primera línea. Se puede decir en este sentido que, con los grandes medios de comunicación, los públicos han salido ganando, y los artistas perdiendo.
Valores esperados: de los análisis de sangre al juego del chuck-a-luck
Aunque lo más llamativo sean los valores extremos y las coincidencias, lo que suele proporcionar más información son los valores medios o los valores «esperados». El valor esperado de una cantidad es la media de los valores que toma, pesados según sus probabilidades respectivas. Por ejemplo, si 1/4 de las veces la cantidad vale 2, 1/3 vale 6, otro 1/3 de las veces vale 15 y el 1/12 restante vale 54, el valor esperado de dicha magnitud es 12. En efecto, 12 = (2 × 1/4) + (6 × 1/3) + (15 × 1/3) + (54 × 1/12).
Consideremos a modo de ilustración el caso de una compañía de seguros domésticos. Supongamos que tiene motivos para pensar que, en promedio, cada año una de cada 10.000 pólizas terminará en una reclamación de 200.000 dólares; una de cada mil, en una reclamación de 50.000 dólares; una de cada cincuenta, en una reclamación de 2.000 dólares, y que el resto no dará lugar a reclamación, esto es, 0 dólares. A la compañía de seguros le interesaría saber cuál es el gasto medio por cada póliza suscrita. La respuesta nos la da el valor esperado, que en este caso es (200.000 × 1/10.000) + (50.000 × 1/1.000) + (2.000 × 1/50) + (0 × 9.789/10.000) = 20 + 50 + 40 + 0 = 110 dólares.
El premio esperado de una máquina tragaperras se calcula de modo análogo. Se multiplica cada premio por la probabilidad de que salga y se suman todos los productos para obtener el valor medio o premio esperado. Por ejemplo, si sacar cerezas en los tres marcadores se paga a 80 dólares y la probabilidad de que esto ocurra es de (1/20)3 (supongamos que hay veinte figuras distintas en cada marcador y que sólo una de ellas es una cereza), multiplicaremos los 80 dólares por (1/20)3 y sumaremos el resultado a los productos análogos obtenidos con los otros premios y sus respectivas probabilidades (consideraremos que una pérdida es un premio negativo).
Y un ejemplo que no es ni mucho menos tan baladí. Consideremos una clínica que analiza sangre en busca de una enfermedad que se sabe afecta a una persona de cada cien. Los pacientes acuden a la clínica en grupos de cincuenta y el director se pregunta si en vez de analizar la sangre de cada uno por separado no le saldría más a cuenta mezclar las cincuenta muestras y analizar el conjunto. Si la muestra total da negativo, podría declarar sanos a los cincuenta, y en caso contrario habría de analizar la sangre de cada miembro del grupo por separado. ¿Cuál es el número esperado de análisis que habría que realizar en caso que se decidiera adoptar este procedimiento?
El director habrá de realizar o bien un análisis (si la muestra mezcla da negativo) o cincuenta y uno (si da positivo). La probabilidad de que una persona esté sana es 99/100, y por tanto la probabilidad de que lo estén las cincuenta que componen el grupo es (99/100)50. Así pues, la probabilidad de que haya de realizar un solo análisis es (99/100)50. Por otra parte, la probabilidad de que por lo menos una persona padezca la enfermedad es la probabilidad complementaria [1 − (99/100)50], y esta es también la probabilidad de que haya que realizar cincuenta y un análisis. Por tanto, el número esperado de análisis necesarios es (1 análisis × (99/100)50) + (51 análisis × [1−(99/100)50]) = aproximadamente 21 análisis.
Si el número de personas que ha de pasar el análisis de sangre es grande, será una sabia decisión por parte del director tomar una parte de cada muestra, mezclarla y analizar primero la muestra mezcla. Y si hace falta, analizará luego por separado los restos de las cincuenta muestras. En promedio, este procedimiento hará que basten veintiún análisis por cada cincuenta personas.
Entender bien el significado del valor esperado es útil en el análisis de la mayoría de juegos de casino, así como del no tan conocido juego del chuck-a-luck, que se juega en los carnavales del Medio Oeste e Inglaterra.
La explicación del chuck-a-luck que se da para atraer a la gente puede ser muy persuasiva. El que apuesta elige un número de 1 a 6 y el encargado lanza tres dados. Si el número elegido sale en los tres dados, el jugador cobra 3 dólares; si sale en dos de los dados, cobra 2 dólares y si sale en uno de los tres dados, sólo cobra 1 dólar. Únicamente en el caso de que el número escogido no salga en ninguno de los dados tendrá que pagar el jugador, y sólo 1 dólar. Con tres dados distintos, el apostador tiene tres posibilidades a su favor; además, a veces gana más de 1 dólar, que es lo máximo que puede perder cada vez.
Como diría Joan Rivers: «¿Podemos calcularlo?». (Si no tienes muchas ganas de calcular, sáltate lo que queda hasta el final de la sección). Está claro que la probabilidad de ganar es independiente del número escogido. Así pues, para concretar, supongamos que el jugador elige siempre el número 4. Como los dados son independientes, la probabilidad de que salga 4 en los tres dados es 1/6 × 1/6 × 1/6 = 1/216. Por tanto, aproximadamente 1/216 de las veces el jugador ganará 3 dólares.
La probabilidad de que salga 4 en dos de los dados es un poco más difícil de calcular, a no ser que se use la distribución binomial de probabilidad de la que hablamos en el Capítulo 1, y que volveré a deducir en el contexto que nos ocupa. Que salga un 4 en dos de los tres dados puede ocurrir de tres maneras distintas y mutuamente excluyentes: X44, 4X4 ó 44X, donde la X significa «no 4». La probabilidad del primero es 5/6 × 1/6 × 1/6 = 5/216. El mismo resultado vale para los otros dos modos restantes. La suma, 15/216, nos da la probabilidad de que salga 4 en dos de los tres dados, la cual nos da a su vez la probabilidad de que el apostador gane 2 dólares.
La probabilidad de sacar un 4 entre los tres dados se calcula de modo análogo, descomponiendo el suceso en los tres modos mutuamente excluyentes en los que este puede ocurrir. La probabilidad de que salga 4XX es 1/6 × 5/6 × 5/6 = 25/216, y esta es también la probabilidad de que salga X4X ó XX4. Sumándolas nos da 75/216 como probabilidad de sacar exactamente un 4 entre los tres dados, esto es, la probabilidad de ganar 1 dólar. Para hallar la probabilidad de que al tirar los dados no salga ningún cuatro, buscamos cuánta probabilidad queda. Es decir, restamos (1/216 + 15/216 + 75/216) de 1 (ó 100%), y obtenemos 125/216. Por tanto, de cada 216 jugadas al chuck-a-luck, el jugador pierde 1 dólar en 125 de ellas.
El valor esperado de las ganancias es pues (3 × 1/216) + (2 × 15/216) + (1 × 75/216) + (−1 × 125/216) = (−17/216) = −0,08 dólares, con lo que, en promedio, el jugador pierde ocho centavos en cada jugada de ese juego tan prometedor.
Eligiendo cónyuge
Hay dos maneras de enfocar el amor: con el corazón y con la cabeza. Por separado, ninguno de los dos da buenos resultados, pero juntos… tampoco funcionan demasiado bien. Sin embargo, si se emplean ambos a la vez, quizá las probabilidades de éxito sean mayores. Es muy posible que, al recordar amores pasados, alguien que enfoque sus romances con el corazón se lamente de las oportunidades perdidas y que piense que nunca jamás volverá a amar así. Otra persona más práctica, que se decida por un enfoque más realista, seguramente estará interesada por el siguiente resultado probabilístico.
Nuestro modelo supone que nuestra protagonista —a la que llamaremos María— tiene buenas razones para pensar que se encontrará con N potenciales cónyuges mientras esté en edad núbil. Para algunas mujeres N pueden ser dos, y para otras, doscientos. La pregunta que se plantea María es: ¿Cuándo habría de aceptar al señor X y renunciar a los otros pretendientes que vinieran después, aunque alguno de estos quizá fuera «mejor» que él? Supondremos que los va conociendo de uno en uno, valora la conveniencia relativa de cada uno de ellos y que, una vez que ha rechazado a uno, lo pierde para siempre.
Para concretar más, supongamos que María ha conocido ya a seis hombres y que los ha clasificado así: 3 5 1 6 2 4. Es decir, de los seis hombres, el primero que conoció ocupa el tercer lugar en el orden de preferencia, el segundo en aparecer ocupa el quinto lugar, prefiere el tercero a todos los demás, etc. Si ahora resulta que el séptimo de los hombres que conoce es mejor que todos los demás excepto su favorito, modificará así la clasificación: 4 6 1 7 3 5 2. Después de cada hombre, María reordena la clasificación relativa de sus pretendientes y se pregunta qué regla habría de seguir para maximizar la probabilidad de escoger al mejor de los N pretendientes que espera tener.
En la obtención del mejor sistema se emplea la idea de probabilidad condicional (que presentaremos en el próximo capítulo) y también hay que calcular un poco. El sistema en sí, no obstante, se describe muy fácilmente. Diremos que un pretendiente es un novio si es mejor que todos los candidatos anteriores. María debería rechazar aproximadamente el primer 37% de los candidatos que probablemente vaya a conocer y luego aceptar al primer novio que le salga de entre los pretendientes posteriores (si es que le sale alguno, claro).
Supongamos, por ejemplo, que María no es demasiado atractiva y que probablemente sólo espera encontrarse con cuatro pretendientes. Supongamos además que estos pueden llegar en cualquiera de las veinticuatro ordenaciones posibles (24 = 4 × 3 × 2 × 1).
Como el 37 por ciento está entre el 25 por ciento y el 50 por ciento, en este caso el sistema es un tanto ambiguo, pero las dos mejores estrategias son las siguientes: A) dejar pasar al primer candidato (el 25 por ciento de N = 4) y aceptar al primer novio que llegue después; y B) dejar pasar a los dos primeros candidatos (el 50 por ciento de N = 4) y aceptar al primer novio que venga luego. Si sigue el sistema A, María elegirá al mejor pretendiente en once de los veinticuatro casos, mientras que si sigue la estrategia B, acertará en diez de los veinticuatro casos.
A continuación mostramos una lista de los veinticuatro, casos posibles de este ejemplo. En cada secuencia el número 1 representa el pretendiente que María preferiría, el número 2 el que elegiría en segundo lugar, etc. De modo que la ordenación 3 2 1 4 indica que primero se encuentra el tercero en orden de preferencia, luego el segundo, después su preferido y finalmente el que menos le gusta de todos. Cada ordenación está indicada con una A o una B para distinguir aquellos casos en los que estas estrategias tendrían éxito y la llevarían a elegir a su preferido.
1234 — 1243 — 1324 — 1342 — 1423 — 1432 — 2134 (A) — 2143 (A) — 2314 (A, B) — 2341 (A, B) — 2413 (A, B) — 2431 (A, B) — 3124 (A) — 3142(A) — 3214 (B) — 3241 (B) — 3412 (A, B) — 3421 — 4123 (A) — 4132 (A) — 4213 (B) — 4231 (B) — 4312 (B) — 4321
Si María es muy atractiva y puede pensar que tendrá veinticinco pretendientes, su mejor estrategia sería también rechazar a los nueve primeros (el 37 por ciento de 25) y quedarse con el primer novio que conozca después. Podríamos comprobarlo también directamente, tabulando como antes todos los casos posibles, pero la tabla resultante sería inmanejable y más vale aceptar la demostración general. (Huelga decir que vale el mismo análisis si la persona que busca cónyuge es un Juan en vez de una María).
Para grandes valores de N, la probabilidad de que aplicando esta regla del 37 por ciento María encuentre a su hombre ideal, es también aproximadamente del 37 por ciento. Luego viene lo más difícil: vivir con el hombre ideal. Hay otras variantes de este mismo modelo que incluyen otros condicionantes, razonables desde el punto de vista romántico.
Las coincidencias y la ley
En 1964 una mujer rubia peinada con una cola de caballo robó el bolso a otra mujer en Los Ángeles. La ladrona huyó a pie, pero posteriormente alguien la reconoció cuando montaba en un coche amarillo conducido por un negro con barba y bigote. Las investigaciones de la policía acabaron por encontrar a una mujer rubia con cola de caballo que regularmente frecuentaba la compañía de un negro de barba y bigote que tenía un coche amarillo. No había ninguna prueba fehaciente que relacionara a la pareja con el delito, ni testigos que pudieran identificar a ninguno de los dos. Se estaba de acuerdo, no obstante, en los hechos citados.
El fiscal basó sus conclusiones en que, como la probabilidad de que tal pareja existiera era tan baja, la investigación de la policía tenía que haber dado con los verdaderos culpables. Asignó las siguientes probabilidades a las características en cuestión: coche amarillo: 1/10; hombre con bigote: 1/4; mujer con cola de caballo: 1/10; mujer rubia: 1/3; hombre negro con barba: 1/10; pareja interracial en un coche: 1/1.000. El fiscal arguyó que como estas características eran independientes, la probabilidad de que todas ellas concurrieran en una pareja elegida al azar había de ser: 1/10 × 1/4 × 1/10 × 1/3 × 1/10 × 1/1.000 = 1/12.000.000, un número tan pequeño que la pareja había de ser culpable. El jurado les condenó.
Los condenados recurrieron ante el Tribunal Supremo de California, que anuló la sentencia sobre la base de otro razonamiento probabilístico. El abogado defensor de la pareja arguyó que 1/12.000.000 no era la probabilidad que había que considerar. En una ciudad de las dimensiones de Los Ángeles, con unos 2.000.000 de parejas, no era tan improbable, sostenía, que hubiera más de una que reuniera todas las características mencionadas, dado que ya había por lo menos una pareja: la condenada. Basándose en la distribución binomial de probabilidad y en el 1/12.000.000, se puede calcular dicha probabilidad, que resulta ser de aproximadamente el 8 por ciento, que, aunque pequeña, permite un margen de duda razonable. El Tribunal Supremo de California aceptó la argumentación del abogado y revocó la sentencia anterior.
Independientemente de las dudas que uno pueda tener con respecto a cómo se obtuvo la cifra de 12.000.000, la rareza por sí misma no prueba nada. Cuando le dan a uno una mano de bridge de trece cartas, la probabilidad de que le den precisamente esa mano concreta es menor que una seiscientos mil millonésima. Y a pesar de ello, será absurdo que, después de recoger las trece cartas, esa persona las examine detenidamente, calcule que la probabilidad de tener precisamente esas trece cartas es menor que una seiscientos mil millonésima y concluya que no puede ser que le hayan dado precisamente esa mano porque es muy improbable que esto ocurra.
En determinados contextos, la improbabilidad es algo que no sorprende. Cada mano de bridge es muy improbable. También lo son las manos de póker y los billetes de lotería. En el caso de la pareja californiana, la improbabilidad es más significativa. Sin embargo, el razonamiento correcto es el de su abogado defensor.
Y a propósito, si las 3.838.380 maneras de escoger seis números de entre cuarenta son todas igualmente probables ¿cómo es que la mayoría de la gente prefiere un billete de lotería con la combinación 2 13 17 20 29 36 a otro con la combinación 1 2 3 4 5 6? Esta es, me parece, una pregunta bastante interesante.
La siguiente anomalía deportiva tiene también implicaciones legales. Consideremos dos jugadores de béisbol, Babe Ruth y Lou Gehrig, pongamos por caso. Durante la primera mitad de la temporada, Babe Ruth tiene en el bateo una media de aciertos mayor que Lou Gehrig. Y en la segunda mitad de la temporada vuelve a ocurrir lo mismo. Pero considerando la temporada entera, ocurre que el promedio de aciertos de Lou Gehrig es mejor que el de Babe Ruth. ¿Puede ser cierto? A primera vista parece como si tal situación fuera totalmente imposible, aunque el mero hecho de haber planteado la pregunta pueda de por sí despertar algunas dudas.
Lo que podría haber ocurrido es que durante la primera mitad de la temporada Babe Ruth tuviera una media de aciertos de 0,300 y Lou Gehrig de sólo 0,290, pero que Ruth hubiera bateado doscientas veces y Gehrig sólo cien. Mientras que en la segunda mitad de la temporada las medias de aciertos fueran 0,400 para Ruth y sólo 0,390 para Gehrig, pero que Ruth hubiera salido a batear sólo cien veces y Gehrig, doscientas. El resultado global para toda la temporada sería un promedio de aciertos de 0,357 de Gehrig frente a 0,333 de Ruth. La moraleja es que no se pueden sacar promedios de promedios.
Hace ya unos años hubo un caso interesantísimo de discriminación en California que presentaba la misma estructura formal que este problema de los promedios de bateo. En vista de la proporción de mujeres en el tercer ciclo de una gran universidad, algunas plantearon un litigio reclamando que habían recibido un trato discriminatorio por parte de la universidad. Cuando los administradores intentaron determinar qué departamentos eran los más culpables, encontraron que en todos ellos el porcentaje de admitidas entre las aspirantes femeninas era mayor que el de admitidos entre los aspirantes masculinos. Sin embargo, las mujeres se presentaban en cantidades desproporcionadamente grandes a departamentos como literatura y psicología, que sólo admitían un reducido porcentaje de los candidatos, mientras que los hombres se presentaban en gran número a departamentos como matemáticas e ingeniería, que admitían un porcentaje de candidatos mucho mayor. El patrón de admisión de los hombres era semejante al patrón de bateo de Gehrig que salió a batear más a menudo en la segunda mitad de la temporada, en la que acertar resultó más fácil.
Otro problema en el que la intuición nos engaña, y en el que también intervienen probabilidades aparentemente desproporcionadas, es el de un hombre de Nueva York que tiene una novia en el Bronx y otra en Brooklyn. Siente el mismo cariño por ambas y por tanto le da lo mismo tomar el metro hacia el Bronx que en sentido contrario, hacia Brooklyn. Como durante todo el día pasan trenes en ambas direcciones, espera que el metro decida a cuál de las dos visitará, y toma siempre el primer tren que pasa. Pero al cabo de un tiempo, la novia de Brooklyn, que está enamorada de él, empieza a quejarse de que sólo ha acudido a una cuarta parte de las citas, mientras que la novia del Bronx, que se ha empezado a hartar de él, empieza a quejarse de que se ha presentado en tres cuartas partes de sus citas. Aparte de ser novato, ¿cuál es el problema de este hombre?
La respuesta es sencilla y viene a continuación, de modo que si quieres pensar un poco no sigas leyendo. El hecho de que los viajes al Bronx sean más frecuentes se debe a la forma particular del horario de trenes. Aunque pasen trenes cada veinte minutos en ambas direcciones, el horario podría ser más o menos como sigue: tren al Bronx, 7:00; tren a Brooklyn, 7:05; tren al Bronx, 7:20; tren a Brooklyn, 7:25; etc. El intervalo entre cada tren de Brooklyn y el siguiente tren del Bronx es de quince minutos, tres veces más largo que el intervalo de cinco minutos entre cada tren del Bronx y el siguiente a Brooklyn. Esto explica por qué se presenta a tres cuartas partes de las citas del Bronx y sólo a una cuarta parte de las de Brooklyn.
Hay un sinfín de otras rarezas semejantes que se derivan de nuestros modos convencionales de medir, expresar y comparar cantidades periódicas, tanto si se trata del cash flow de un gobierno como de las fluctuaciones diarias de la temperatura corporal.
Monedas no trucadas y ganadores o perdedores en el juego de la vida
Imaginemos que tiramos una moneda al aire varias veces seguidas y obtenemos una sucesión de caras (C) y cruces (c), por ejemplo: CCcCccCCcCcccCccCCCcCccCCcCCccCcCCccCCcCcCCCCcCCCcc. Si la moneda no está trucada, en esas sucesiones ocurre una serie de cosas verdaderamente raras. Por ejemplo, si se está al tanto de la proporción de las veces en que el número de caras es mayor que el de cruces, se observa con sorpresa que raras veces es cercana a la mitad.
Imaginemos a dos jugadores, Pedro y Pablo, que juegan a cara o cruz, tirando una moneda al aire una vez por día. En un momento dado, diremos que Pedro va ganando si hasta aquel momento han salido más caras que cruces, y en caso contrario es Pablo quien va ganando. En cualquier momento, tanto Pedro como Pablo tienen la misma probabilidad de ir ganando, pero sea quien sea el que vaya ganando, este es el que tiene mayor probabilidad de haber estado ganando más rato. Si han tirado la moneda cien veces y acaba ganando Pedro ¡es considerablemente mayor la probabilidad de que este haya estado por delante más del 90 por ciento del tiempo, pongamos, que la de que lo haya estado entre el 45 y el 55 por ciento! Y análogamente, si acaba ganando Pablo, la probabilidad de que este haya estado ganando más del 96 por ciento del tiempo es mucho menor que la de que lo haya estado entre el 48 y el 52 por ciento.
Quizás este resultado sea tan contrario a la intuición porque la mayoría de la gente suele pensar como si las desviaciones de la media estuvieran atadas a una banda elástica, de modo que, cuanto mayor fuera la desviación, mayor sería la fuerza recuperadora que tendiese a restaurar la media. La creencia errónea de que el hecho de que hayan salido varias caras seguidas hace más probable que la próxima vez salga cruz se conoce como «sofisma del jugador» (las mismas ideas valen para la ruleta y los dados).
La moneda no sabe nada, no obstante, de medias ni de bandas elásticas, y si ha salido cara 519 veces y cruz 481, es tan probable que la diferencia entre caras y cruces aumente como que disminuya. Y esto es cierto a pesar de que la proporción de caras tienda a 1/2 a medida que aumenta el número de tiradas. (No hay que confundir el sofisma del jugador con otro fenómeno, la regresión a la media, que sí se cumple. Si tiramos la moneda otras mil veces es más probable que el número de caras de la segunda tanda de mil tiradas sea menor de 519 que lo contrario).
En términos relativos, las monedas se comportan bien: el cociente entre el número de caras y el de cruces de una sucesión de tiradas tiende a 1 a medida que aumenta el número de estas. En cambio, se comportan mal en términos de cantidades absolutas: la diferencia entre el número de caras y el de cruces tiende a aumentar cuantas más veces tiramos la moneda al aire, y los cambios en el liderato, de caras a cruces o viceversa, tienden a hacerse cada vez más raros.
Si hasta las monedas no trucadas se portan tan mal en términos absolutos, no es, ni por asomo, sorprendente que algunas personas acaben ganándose fama de «perdedores» mientras que otras se la ganen de «ganadores», a pesar de que entre ellos no haya más diferencia real que la buena o mala suerte. Desgraciadamente quizá la gente es más sensible a las diferencias absolutas entre personas que a las igualdades aproximadas. Si Pedro y Pablo han ganado 519 y 481 veces, respectivamente, es muy probable que se etiquete a Pedro de ganador y a Pablo de perdedor. En mi opinión, los ganadores (y los perdedores) sólo son, a menudo, personas que se han quedado atascados en el lado bueno (o malo) del tanteador. En el caso de las monedas puede pasar mucho tiempo antes de que la suerte cambie, y a menudo mucho más que una vida medianamente larga.
La cantidad sorprendente de veces que salen series de caras o cruces consecutivas de distintas longitudes es la causa de más ideas contrarias a la intuición. Si todos los días Pedro y Pablo apuestan la comida tirando al aire una moneda no trucada, y consideramos un intervalo de tiempo de unas nueve semanas, es más probable que tanto Pedro como Pablo hayan ganado una serie de cinco comidas seguidas que lo contrario. Y si consideramos un período de entre cinco y seis años, es probable que tanto uno como otro hayan ganado diez comidas seguidas.
La mayoría de la gente no se da cuenta de que los sucesos aleatorios pueden presentar una apariencia completamente ordenada. He aquí una sucesión aleatoria de Xs y Os, obtenida mediante ordenador, en la que cada letra tiene probabilidad 1/2.
OXXXOOOXXXOXXXOXXXXOOXXOXX
OXOOXOXOOOOXOXXOOOXXXOXOXX
XXXXXXXOXXXOXOXXXXOXOOXXXO
OOXXXXXOOXXOOOXXOOOOOXXOOX
XXXXXOXXXXOOXXXXOOXXOXXOOX
XOXOXOOXXXOXXOXXXXOXXOXXXX
XXXXXOXXXXXOOOOOXOOXXXOOXX
XXOOXOOXOXXXOXXXXOOOOXOXOX
XOXXXOOXXOOOOXXXXXOOOOXXXX
OXXOOXXXXXXOXXOOOOOOOXOXXX
XXOOOXXOXXXOOOOXOXOXOOXXXX
OXOXXXOXXOOXXOXOOXOOXXXOXX
Obsérvese la cantidad de series y el modo en que aparentemente se forman grupos y pautas. Si nos viéramos obligados a explicarlos habríamos de recurrir a razonamientos que serían necesariamente falsos. De hecho se han realizado estudios en los que se han dado a analizar fenómenos aleatorios como el anterior a expertos en el campo correspondiente, y estos han logrado encontrar «explicaciones» convincentes de las pautas.
Teniendo esto presente, piénsese en algunas de las declaraciones de los analistas de la bolsa. Es cierto que las alzas y las caídas de un cierto valor, o de la bolsa en general, no son absolutamente aleatorias, pero no es descabellado pensar que el azar juega un papel muy importante en ellas. Sin embargo, uno nunca llegaría a pensar esto a partir de los pulcros análisis a posteriori, que siguen al cierre de cada sesión. Los comentaristas tienen siempre un reparto habitual de personajes a los que recurrir para explicar cualquier recuperación o cualquier descenso. Siempre tienen a mano la realización de las plusvalías, el déficit federal, o cualquier otra cosa para explicar los giros a la baja, y el aumento de los beneficios de las sociedades, el aumento de los tipos de interés o lo que sea para explicar los giros alcistas. Un comentarista casi nunca dice que la actividad de la bolsa de ese día o de tal semana ha obedecido, por lo general, a fluctuaciones aleatorias.
La racha de suerte y el manitas
Los grupos, series y pautas que presentan las sucesiones aleatorias son hasta cierto punto predecibles. Las sucesiones de caras y cruces de una longitud dada, pongamos veinte tiradas, tienen generalmente cierto número de series de caras consecutivas. Diremos que una sucesión de veinte tiradas de una moneda que diera diez caras seguidas y diez cruces (CCCCCCCCCCcccccccccc) tiene sólo una serie de caras, mientras que una sucesión de veinte tiradas que diera alternativamente cara y cruz (CcCcCcCcCcCcCcCcCcCc) tiene diez series de caras. Es muy improbable que esas dos sucesiones hayan sido generadas al azar. Es más probable, sin embargo, que en una sucesión aleatoria de veinte tiradas se obtengan seis series de caras (por ejemplo, CCcCCcCccCCCccCCccCc).
Criterios parecidos nos pueden servir para determinar si cierta sucesión de caras y cruces, o de aciertos y fallos, es debida al azar. De hecho, los psicólogos Amos Tversky y Daniel Kahneman han analizado las sucesiones de aciertos y fallos de jugadores profesionales de baloncesto que tenían un porcentaje de realización del 50 por ciento y resultó que parecían ser completamente aleatorias; parece que en baloncesto no hay rachas de suerte. Las rachas que había eran, con toda probabilidad, debidas al azar. Si un jugador intenta veinte tiros por partido, por ejemplo, tiene una probabilidad de casi el 50 por ciento de meter por lo menos cuatro cestas seguidas en algún momento del partido. Tiene una probabilidad de entre el 20 y el 25 por ciento de conseguir una serie de cinco o más canastas seguidas, mientras que la probabilidad de que la serie sea de seis o más canastas es aproximadamente del 10 por ciento.
Se puede pulir más el razonamiento para tratar el caso de que la media de aciertos del jugador sea distinta del 50 por ciento, y parece que valen resultados parecidos. Un jugador que marca el 65 por ciento de sus tiros, pongamos, marca tantos del mismo modo que «marca» caras en una moneda trucada que cae cara en el 65 por ciento de las veces que la tiramos; es decir, cada tiro es independiente del anterior.
Siempre he tenido la sospecha de que cosas como «rachas de suerte» o «manitas» o un «equipo que siempre remonta» no eran más que exageraciones de los periodistas deportivos, sin otra intención que tener algo de que hablar. Seguramente tales expresiones signifiquen algo, pero demasiado a menudo sólo son fruto de un intento mental por descubrir un significado donde no hay más que probabilidad.
En béisbol, una racha muy larga de aciertos constituye una especie de récord especialmente extraordinario, tan improbable que parece prácticamente inasequible y casi inmune a la predicción probabilística. Hace unos cuantos años, Pete Rose estableció un récord en la National League con tiros certeros en cuarenta y cuatro partidos seguidos. Si para simplificar suponemos que bateó al 0,300 (esto es, que acertó el 30 por ciento de las veces y falló el 70 por ciento restante), y que salió a batear cuatro veces por partido, su probabilidad de no acertar ninguna vez en un partido dado, suponiendo la independencia, era de (0,7)4 = 0,24. (Recordemos que independencia significa que acierta del mismo modo en que sale cara cuando tiramos una moneda trucada que da caras el 30% de las veces). Así pues, la probabilidad de que acertara por lo menos una vez en cualquier partido era de 1 − 0,24 = 0,76. Y por tanto, la probabilidad de que acertara por lo menos una vez en todos los partidos de una serie de cuarenta y cuatro era de (0,76)44 = 0,0000057. Muy pequeña, efectivamente.
La probabilidad de que hubiera acertado en una serie consecutiva de exactamente cuarenta y cuatro partidos de entre los 162 que componen la temporada es mayor: 0,000041, que se calcula sumando todas las posibles maneras en que podría haber conseguido tal serie de exactamente cuarenta y cuatro partidos, sin tener en cuenta el caso en que hubiera conseguido más de una de tales series, cuya probabilidad es despreciable. La probabilidad de que haya marcado aciertos en cuarenta y cuatro partidos o más es unas cuatro veces mayor. Si multiplicamos esta última cantidad por el número de jugadores de las Major Leagues (redondeando bastante a la baja para tener en cuenta que hay jugadores con promedios de bateo inferiores) y multiplicamos por el número aproximado de años en que se ha jugado al béisbol (haciendo los ajustes convenientes para reflejar que el número de jugadores varía de una temporada a otra), vemos que en realidad no es tan improbable que en algún momento un jugador de las Major Leagues haya acertado siempre en cuarenta y cuatro partidos seguidos o más.
Una última observación: he considerado la serie de cuarenta y cuatro partidos de Rose en vez de la serie aparentemente más impresionante aún de DiMaggio, de cincuenta y seis partidos, porque, dada la diferencia entre sus respectivos promedios de bateo, la serie de Rose fue una hazaña ligeramente más improbable (incluso teniendo en cuenta que las temporadas de Rose eran más largas, con 162 partidos).
Los acontecimientos raros, como las series de bateos, que son fruto del azar, no se pueden predecir individualmente. Lo que sí se puede describir en términos de probabilidad es la estructura de su aparición. Consideremos un tipo de hechos más prosaico. Durante un período de diez años, se hace un seguimiento de mil matrimonios que desean tener tres hijos. Supongamos que 800 de las parejas lo consiguen en dicho período. La probabilidad de que cualquiera de las parejas tenga tres hijas es 1/2 × 1/2 × 1/2 = 1/8; por tanto, aproximadamente cien de las 800 parejas tendrán tres hijas cada una. Por simetría, aproximadamente cien de las parejas tendrán tres chicos. Hay tres sucesiones distintas en las que cada familia puede tener dos hembras y un varón —HHV, HVH o VHH, donde el orden de las letras indica el orden de nacimiento— y cada una de estas sucesiones tiene una probabilidad de 1/8 o (1/2)3. Por tanto, la probabilidad de tener dos chicas y un chico es 3/8, con lo que aproximadamente 300 de las 800 parejas tendrán este tipo de descendencia. Y también por simetría, unas 300 parejas tendrán dos chicos y una chica.
Este último caso que acabamos de considerar no tiene nada de sorprendente, pero el mismo tipo de descripción probabilística (empleando unas matemáticas ligeramente más difíciles que la distribución binomial) se puede aplicar a los acontecimientos muy raros. El número de accidentes anuales en un cruce concreto, el número de aguaceros anuales que caen en un desierto determinado, el número de casos de leucemia en una comarca dada, el número de muertes anuales por coz de caballo en ciertos regimientos de caballería del ejército prusiano, etcétera, todos estos casos han sido descritos con gran precisión usando la distribución de probabilidad de Poisson. Primero hay que conocer aproximadamente la improbabilidad del hecho y, una vez conocida, se puede usar esta información junto con la fórmula de Poisson para tener una idea bastante aproximada de, por ejemplo, cuántos años pasarán sin que haya muertos por coz de caballo, en qué porcentaje de los años venideros habrá una de tales muertes, en qué porcentaje habrá dos, etc. De modo análogo, se puede predecir el porcentaje de los años en los que no habrá precipitaciones de lluvia en un desierto, una precipitación, dos, etcétera.
En este sentido, podemos decir que hasta los sucesos raros son completamente predecibles.