2
Entre la subjetividad y la probabilidad impersonal

Estaba demasiado cansado para advertir la ironía, la casualidad o lo que fuese. Había demasiadas ironías y casualidades. Algún día, un individuo astuto fundaría una religión basada en la casualidad, si es que no lo había hecho ya, y ganaría un millón de dólares.

Don DeLillo

Si existe una disposición genética al materialismo (en el sentido de que «la materia y el movimiento son la base de todo lo que hay», no en el de «quiero más coches y más casas»), entonces sospecho que la tengo. Recuerdo que cuando tenía diez u once años me estaba peleando con uno de mis hermanos pequeños y entonces comprendí, como en una revelación, que la sustancia que teníamos dentro del cráneo no era de naturaleza distinta de la sustancia de la áspera alfombra que acababa de despellejarme el codo, ni de la sustancia de la silla contra la que mi hermano se había golpeado reculando. La conciencia de que todo, en última instancia, está hecho de la misma materia, de que no hay ninguna diferencia esencial entre la composición material de mi persona y de lo que no es mi persona, era clara, nítida y estimulante.

Con el solipsismo que, como creo desde entonces, es frecuente entre los niños, estaba seguro de que nunca había concebido una agudeza así. Un par de años después apunté en un papel el siguiente silogismo: «Todo está compuesto de átomos. Los átomos no piensan. Luego nadie piensa en realidad». Doblé bien el papel, lo cubrí con cinta adhesiva, lo metí en un bote de polvos de talco que ya estaba vacío, sellé la tapa metálica con pegamento y enterré el bote en el patio trasero, al lado del columpio, para que lo descubrieran las futuras (e irreflexivas) generaciones.

El atomismo infantil evolucionó rápidamente y se transformó en un ateísmo adolescente que no toleraba las historias escuetas y sin pruebas. La falta de respuesta a la pregunta sobre qué generó, precedió o creó a Dios convertía a mis ojos la existencia del mentado Ser en un misterio innecesario y preexistente. ¿Por qué introducirlo? ¿Por qué postular un desconcierto extra, absolutamente «anexplicativo», para explicar este hermoso mundo, ya desconcertante de por sí? Puestos a cultivar misterios innecesarios, ¿por qué no introducir otras preexistencias, como el Creador del Creador o Su Tío Abuelo? La idea del azar (¿o debería decir el Azar?) también me fascinaba; recuerdo el efecto que me produjo oír el tópico «todo está escrito» en boca de un amigo de mis padres que juzgaba el papel de la casualidad en la vida. Yo siempre había creído que aquella persona era más bien necia, y la observación, que reflejaba pensamientos míos que yo consideraba entonces profundísimos, me impresionó.

Al hacerme mayor, mi preocupación por encontrar un enfoque científico y no narrativo de las cosas pasó del más allá al más aquí. Recuerdo haber pensado que la frecuencia de los estampidos que oía en la sartén de las palomitas de maíz seguía cierta distribución auditiva normal: estampidos iniciales, aumento de ritmo, meseta, descenso del ritmo y turno de los rezagados. Recuerdo que en el instituto leí que una de cada cinco chicas que estudiaban segunda enseñanza no era virgen y que a continuación quise averiguar la probabilidad de que hubiera no vírgenes en cierto grupo de chicas que conocía. Empecé a fijarme en la interpretación literal de los rótulos callejeros (LA GRUA SE LLEVARÁ A LOS INFRACTORES debería ser LA GRUA SE LLEVARÁ EL VEHICULO DE LOS INFRACTORES; y NO TIRAR PAPELES nos autoriza a tirar chicles gastados, cáscaras de frutos secos y restos de bocadillo) y me consideraban un bicho raro por estas hazañas.

Arquímedes dijo: «Dadme un punto de apoyo y moveré el mundo». La afirmación revela la naturaleza teórica y el anhelo de trascendencia de las matemáticas. En vez de punto de apoyo y mundo, yo tenía palomitas de maíz, no vírgenes y rótulos callejeros, pero acabé teniendo en alta estima la idea de Arquímedes.

Pero yo soy yo. Los lectores, sin duda, serán diferentes. A semejanza de los personajes de las historias, nuestros puntos de vista pueden parecer un poco raros. Incluso cuando el tema va más hacia lo mundano que hacia lo metafísico, hay con frecuencia una grieta ancha entre las probabilidades subjetivas, las posibilidades que otorgamos a sucesos inseguros, y otras evaluaciones más objetivas de las probabilidades de esos mismos sucesos, especialmente cuando nos afectan personalmente. Como han advertido con frecuencia los observadores, las personas tienden a exagerar la probabilidad de los sucesos nuevos, emocionantes, intensos o concretos, y a subestimar la probabilidad de los sucesos viejos, apáticos, aburridos o abstractos.

Nuestra condición de minoría (en tanto que individuos, somos el único miembro de la minoría menor que existe) y nuestro punto de vista característico afectan también a nuestra idea de la coincidencia personal. Partiendo del hecho geométrico y existencial de que nuestro ser está en el centro de nuestra historia y en la periferia de las historias de los demás, muchos llegamos al mismo tiempo a la algo extravagante conclusión de que nuestra vida abunda en coincidencias y sucesos notables, mientras que la de los demás es más bien típica. Pero cada uno de nosotros es único; exactamente como todos los demás.

Puntos de vista minoritarios, individuos y estadísticas

Más interesante que las redes concretas de asociaciones personales es la forma en que la condición de minoría (un ingrediente crucial en la identidad de muchas personas) empaña el enfoque de múltiples asuntos sociales. El punto o puntos de vista de una minoría puede resultar, de un modo curiosamente elemental, influido por la probabilidad y la estadística.

Ilustraré la cuestión con un experimento mental. (La expresión «experimento mental» se refiere a una investigación imaginaria de un fenómeno que pretende captar su esencia sin entrar en detalles engorrosos). Hay un aspecto muy delicado de la vida estadounidense, las relaciones raciales, que necesita ciertamente de experimentos mentales, por simplistas que sean. Experimentemos pues y supongamos que, en contra de lo que dicen los hechos, negros y blancos tienen la misma importancia e influencia. Supongamos además que alrededor del 10 por ciento de cada grupo es racista y que el país está integrado tanto a nivel residencial como profesionalmente. Partiendo de estas fantásticas suposiciones, es fácil demostrar que, como los negros componen aproximadamente el 13 por ciento de la población y los blancos el 87 por ciento restante (en nuestro ejemplo, los blancos son los no negros), los negros seguirán siendo víctimas del racismo a un nivel desproporcionado.

La probabilidad de que un blanco coincida con un negro racista en el conjunto de sus encuentros con cualquier clase de persona es del 1,3 por ciento (el 10 por ciento del 13 por ciento), mientras que la probabilidad de que le pase lo mismo a un negro es del 8,7 por ciento (el 10 por ciento del 87 por ciento). Esta disparidad se acentúa conforme aumenta la cantidad de contactos de una persona.

Si un blanco coincide con cinco personas, la probabilidad de que conozca por lo menos a un racista es del 6,3 por ciento, mientras que la cantidad media de racistas que conocerá será de 0,07. Por el contrario, si un negro coincide con cinco personas, su probabilidad de conocer por lo menos a un racista es del 36,6 por ciento, y la cantidad media de racistas que conocerá será de 0,44. Si un blanco coincide con 25 personas, su probabilidad de conocer por lo menos a un racista se eleva al 27,9 por ciento, y la cantidad media de racistas que conocerá se elevará a 0,33. Si un negro coincide con 25 personas, su probabilidad de conocer por lo menos a un racista se eleva al 89,7 por ciento, y la cantidad media de racistas que conocerá se elevará igualmente a 2,18.

La conclusión es que la condición de minoría puede hacer, por sí sola, que la igualdad de oportunidades sea difícil de conseguir o de mantener. En realidad, aun manteniendo las fabulosas condiciones anteriores, pero con un 2 por ciento de blancos racistas y un 10 por ciento de negros racistas, los negros seguirían afrontando más racismo que los blancos.

ΩΩΩ

La mayoría de los modelos simples ganan en realismo cuando se introducen en ellos suposiciones más complejas. Me gustaría añadir un par al ejemplo que acabamos de ver. Primera, sustituyamos el racismo por los prejuicios o por un rechazo en general. Además, no supongamos que los individuos o tienen prejuicios o no los tienen, sino que todos los individuos los tienen pero en diferentes grados que pueden expresarse en porcentajes. Las cantidades barajadas en el ejemplo tendrían que retocarse un poco, pero al final tendríamos el mismo resultado: los componentes de un grupo minoritario tropezarían con más prejuicios que los de un grupo mayor. A continuación supongamos que el grupo minoritario consta de muy pocos miembros, por ejemplo de una familia. El efecto, como es lógico, sería una exageración. Esta familia sería objeto, por lo general, de muchísimos más prejuicios y rechazos de los que devolvería al mundo exterior (y he dicho por lo general porque la familia en cuestión podría ser realmente inmunda).

Hagamos avanzar un paso a nuestro guión y reduzcamos la familia a un individuo. También aquí, el individuo sería objeto, por lo general, de muchísimos más prejuicios y rechazos de los que dicho individuo manifestaría contra el mundo exterior (y también aquí, «por lo general» se refiere a la excepción inmunda). Y no sólo nos enfrentamos a prejuicios y rechazos; todos empezamos a vivir como seres pequeños y sabemos en lo más profundo qué es la impotencia. Los casos de impotencia son mucho más frecuentes que los de prejuicio.

Estas consideraciones elementales arrojan alguna luz sobre por qué tantos nos creemos víctimas indefensas. Aunque casi todos, según nuestros propios cálculos por lo menos, procuramos ser amables y educados con los demás, vemos con frecuencia que estos «demás» son groseros y desconsiderados con nosotros. Parte de la explicación procede de la aritmética y la probabilidad, aunque sería preferible no decírselo al conductor picajoso que se baja del coche para protestar porque hemos descubierto al mismo tiempo que él «su» plaza de aparcamiento.

Adviértase que en el análisis precedente sólo ha habido un elemento convencional de la narrativa que desempeñase algún papel: la sencilla idea del punto de vista de un sujeto. La riqueza y complejidad de casi todas las situaciones cotidianas oscurecen la percepción de las explicaciones aritméticas. Sobre las situaciones de la ficción pueden hacerse observaciones parecidas. Contemplar sucesos desde el punto de vista de un personaje de una historia o por los ojos del narrador no favorece el razonamiento probabilístico. Lo más probable es que el lector se explique los acontecimientos más improbables mediante hechos o suposiciones inconcretos.

La ley de Murphy y la sensación de que nos tratan mal

Otro ejemplo de conexión entre personalización de sucesos y paranoia débil es la ley de Murphy. Formulada inicialmente por el ingeniero Edward Murphy, afirma que, por lo general, cualquier cosa que pueda salir mal saldrá mal. A pesar del aspecto humorístico de esta caracterización, hay cierta profundidad en el fenómeno que describe. En muchas situaciones, que las cosas no salgan bien no se debe a la mala suerte de las personas, sino a la complejidad e interdependencia de muchos sistemas.

Hay un ejemplo doméstico y no intuitivo de la ley de Murphy que procede de la teoría de la probabilidad y que ha desarrollado recientemente el autor científico Robert Matthews. Imaginemos que tenemos 10 pares de calcetines y que a pesar de nuestros mejores deseos desaparecen seis calcetines. (Resolver el problema de la desaparición de los calcetines y su paradero es otra búsqueda del santo grial). La pregunta es: ¿qué es más probable, que tengamos suerte y acabemos con siete pares completos (es decir, que los seis calcetines perdidos formen tres pares) o que no tengamos suerte y terminemos con sólo cuatro pares completos (es decir, que los seis calcetines perdidos sean totalmente distintos entre sí)? La sorprendente respuesta es que es más de cien veces más probable que al final nos quedemos con el peor resultado posible, sólo cuatro pares (y seis calcetines sueltos), que con el mejor resultado posible, siete pares (y ningún calcetín desparejado). Para ser más exactos, la probabilidad de los siete pares es de 0,003, la de seis pares de 0,130, la de cinco pares de 0,520 y la de cuatro pares de 0,347.

La solución (cuyos detalles omitiré) procede de la idea de independencia estadística, que es de interés fundamental y merece una digresión. Se dice que dos acontecimientos son independientes cuando la incidencia de uno no hace ni más ni menos probable la incidencia del otro. Si lanzamos una moneda al aire dos veces, cada lanzamiento es independiente del otro. Si elegimos dos personas por la guía telefónica, el mes de nacimiento de una es independiente del de la otra. Calcular la probabilidad de incidencia de dos acontecimientos independientes es muy sencillo: basta con multiplicar las probabilidades respectivas. Así, la probabilidad de obtener dos caras es 1/4: 1/2 × 1/2. La probabilidad de que dos personas elegidas por la guía telefónica hayan nacido en junio es 1/144: 1/12 × 1/12. Este principio multiplicador aplicado a las probabilidades se puede extender a series de acontecimientos (como en los párrafos que hemos dedicado al racismo).[6] La probabilidad de que un dado saque un 3 en cuatro tiradas seguidas es (1/6)4; de que salga siempre cara tirando la moneda seis veces seguidas, (1/2)6; de que sobrevivamos a tres disparos en la ruleta rusa, (5/6)3.

¡La tendencia de los calcetines a deshacerse de sus parejas es realmente ley de Murphy con ganas! Sin embargo, esto es lo esperable y no hace falta apelar a la mala suerte para explicar los calcetines sueltos. Sé que casi todas las personas que hablan de pequeñas desdichas personales en serie se limitan a adornar una anécdota o a intentar relacionarla con otras, y no creen por necesidad en sus afirmaciones, del mismo modo que muchas personas hablan del coco o del hombre del saco sin creer en él. Sin embargo, solemos sentirnos realmente confusos y pensar que el mundo conspira contra nosotros, y los desenmascaramientos matemáticos contribuyen a deshacer el hechizo.

El engrandecimiento personal es la clave del atractivo que ejercen los espejismos y la paranoia en general. La impresión es consecuencia de la deducción, quizás inconsciente, de que si el mundo anda tras de mí, es que tengo que ser muy importante. A estas personas les cuesta atenerse al hecho muy probable de que casi nadie daría por ellas un par de calcetines.

En un mundo cada vez más complejo e interrelacionado, a veces cuesta relativamente poco derribar un sistema. Un par de calcetines se destruye cuando se pierde uno. Un nutrido conjunto de partes conectadas más o menos en serie (de manera que, si una falla, el sistema también) es más vulnerable aún, y lo mismo le ocurre a nuestro cuerpo. Cuando se producen estos fallos (entre los que yo incluiría, además de los calcetines sueltos, las enfermedades y los accidentes), las historias que nos contamos y nos creemos tienen una importancia real. La ley de Murphy ilustra muy bien un aspecto de esta relación entre las historias, nosotros y la estadística.

ΩΩΩ

Otro ejemplo de la ley de Murphy es la paradoja del tiempo de espera. Supongamos que estamos estancados en una aldea perdida del Sahara y se nos dice que, por término medio, pasan dos autobuses diarios que van a la civilización. Si llegamos a la aldea en un momento aleatorio y si los autobuses pasan cada doce horas, el tiempo medio de espera será de seis horas (menos de una hora si tenemos suerte, más de once horas si no tenemos ninguna, pero también podría ser cuatro horas, ocho, etcétera), lo que, por otra parte, es una buena estimación del tiempo de espera en una situación así.

Pero si la hora de llegada de los autobuses varía, el tiempo medio de espera se prolongará. Supongamos, por ejemplo, que un autobús llega siempre a medianoche y el otro a las dos de la madrugada, y que también esta vez llegamos a la aldea en un momento aleatorio. Si aparecemos en el intervalo de dos horas que hay entre las doce y las dos, que es 1/12 del tiempo, nuestro tiempo medio de espera será de una hora. Si aparecemos en el intervalo de veintidós horas que hay entre las dos de la madrugada y las doce de la noche, que son 11/12 del tiempo, nuestra espera media será de once horas. Puesto todo junto, nos da una espera media de (1/12 × 1 + 11/12 × 11), o lo que es igual, 10 1/6 horas.

La derivación no es tan importante como la conclusión: cualquier variación en la llegada de los autobuses redunda en una prolongación del tiempo de espera, aunque la media de autobuses diarios sea siempre la misma.

El fenómeno de las esperas que se alargan aparece por lo general en situaciones que van desde las colas del supermercado hasta los consultorios médicos. Aunque ni la cantidad media de clientes o pacientes que llegan por hora ni el tiempo medio que se dedica a cada uno sean para colapsar la situación, la esperanza de que no se colapse suele depender de la homogeneidad del ritmo de llegada de las personas y de que a todo el mundo se le dedique el mismo tiempo. Si no se dan estas dos condiciones, la culpa del retraso la tiene la variación, no la malevolencia cósmica.

Desde luego, no siempre deberíamos considerar negativas las esperas largas; si estamos esperando a unos invitados realmente detestables, por ejemplo, la prolongación de la espera podría calificarse de positiva. Pero parece que tenemos un don especial para fijarnos en lo negativo. Hacerlo seguramente confiere valor de supervivencia y aquí podría estar la verdadera base de la ley de Murphy y de la sensación, generalmente desencaminada aunque corriente, de que nos tratan mal.

Psicología, perspectivas y paranoia

La fragilidad psicológica contribuye igualmente a explicar nuestra tendencia a sentirnos más ofendidos que ofensores. Hay una diferencia notable, por ejemplo, entre el grado de aceptación manifiesta que los otros necesitan de nosotros para sentirse apreciados y respetados, y el grado de reprobación tácita que pueden merecernos sin que dejemos de apreciarlos y respetarlos. Las valoraciones positiva y negativa no están al mismo nivel.

La sensibilidad y vulnerabilidad de las personas dificultan la censura manifiesta. El cotilleo nos permite expresar ciertas censuras, pero también aquí hay una brecha entre el desdén que solemos atribuir a los que cotillean sobre nosotros y la imparcialidad de que creemos hacer gala cuando cotilleamos sobre otros. Manifestar confianzudamente un poco de burla y menosprecio hacia otros es totalmente coherente con el afecto y respeto que sentimos por ellos. Por desgracia, pocos son los que pueden tolerar la burla y el menosprecio de otros (fuera del círculo familiar) y seguir creyendo que se les aprecia y respeta.

De la sensación de que abusan de nosotros (y de su pariente próximo, la impresión de que somos especiales), surgen muchos temas políticos. Un ejercicio interesante consiste en advertir de qué miembros del Congreso es más probable que la prensa diga que han tenido un voto decisivo cuando se aprueba un decreto por un solo voto de diferencia. Matemáticamente se puede decir de cualquier miembro de la mayoría, como es natural. Psicológicamente, sin embargo, un factor que podría decidir la atribución podría ser la sorpresa suscitada por un diputado, que ha votado contra su partido. Otro factor podría ser la medida en que el diputado nada entre dos aguas, como también el que la decisión del diputado sea reciente.

Lo bueno de un voto tan próximo, desde el punto de vista de los medios informativos locales, es que docenas de editorialistas y una variedad de expertos pueden afirmar que de no haber sido por ese diputado no se habría aprobado el decreto. Si el presidente no hubiera presionado al congresista, si éste no hubiera visto la luz de pronto, o no hubiera recibido un sobre de dinero fácil, habría votado de otra manera. El margen de un voto hace lo que los medios informativos (locales) deben hacer habitualmente por sí mismos: personalizar los temas sociales.

En un sentido más amplio, la psicología proporciona una cantidad de vigas útiles para salvar el abismo que hay entre las estadísticas y las historias. La ley de Murphy es sólo una entre las diversas barreras psicológicas de control que a menudo obstaculizan nuestra percepción de los fenómenos aleatorios y en consecuencia, a la postre, nuestra concepción de nosotros mismos. Una persona que tiembla de miedo por cada nueva enfermedad que se descubre y es indiferente a los peligros del tabaco o de conducir en estado de embriaguez es distinta (no básicamente distinta, pero tampoco en una medida insignificante) de otra con una valoración más segura de los riesgos relativos que afrontamos. Hay una voluminosa literatura psicológica sobre nuestra percepción del riesgo y el azar.

La facilidad con que podemos recuperar datos de la memoria influye mucho en la idea que tenemos de multitud de asuntos, como sugieren las respuestas a las siguientes preguntas: ¿Qué hay más, palabras que empiecen por erre o palabras que tengan la erre en tercer lugar? ¿Y si se trata de la letra eme? Casi todos creen, incorrectamente, que hay más palabras con estas letras en primera posición que en tercera, porque, como han teorizado Amos Tversky y Daniel Kahneman en su clásico Judgement under uncertainty (Juicios en la incertidumbre), lo primero que nos viene a la memoria es el primer grupo de palabras. Vocablos como ratón, radio, Rembrandt, ruleta y reumatismo son más fáciles de rememorar que terraza, torcedura, Vermeer, abril y parálisis.

Se ha identificado cierta cantidad de precisiones y corolarios del llamado error de disponibilidad. Entre ellos ocupan un lugar prominente el efecto aureola, es decir, la inclinación de las personas a juzgar una cosa u otra persona por una característica destacada (por ejemplo, haber estudiado en Yale, Harvard, Princeton, Columbia y demás universidades de la Ivy League), y el efecto ancla, la tendencia de las personas a detenerse, o por lo menos a no alejarse mucho, en el primer número o dato que se les presenta en una conversación dada (por ejemplo, la cantidad de esclavos transportados a Occidente). Las dos tendencias reflejan una escasez conceptual muy corriente. En el paso de la cruda realidad de las estadísticas a la maleabilidad interpretativa de las historias, las tendencias de este estilo desempeñan un papel fundamental, aunque apenas reconocido.

La suma de la conducta de muchas personas es más difícil de entender. El comportamiento de la multitud cae a veces en la histeria de masas, y más de una vez el catalizador es un solo individuo. Incluso en organizaciones más tranquilas que las multitudes (los comités de organización, por ejemplo), las interacciones entre miembros tienden con frecuencia, como han expuesto Irvin Janis y otros investigadores, a generar parcialidades y serias subestimaciones de probabilidades. Puesto que los miembros desean que el grupo los valore, expresan espontáneamente opiniones en consonancia con lo que creen que es la actitud del grupo y reprimen las ideas en contra. No tarda en levantarse una confirmadora brisa de prejuicios. Aparecen líderes más extremados que el miembro medio, los cuales suelen rodearse de aduladores antes que de personas de orientación más independiente, y acaban ganándose el respeto de casi todos los demás, en particular si el líder en cuestión puede influir en su futuro.

Las investigaciones sugieren igualmente que los grupos con esta clase de líderes tienen más probabilidades de embarcarse en empresas arriesgadas basadas en coincidencias insignificantes y de hacerlo con más decisión que los individuos aislados, como fue el caso de los suicidios de Puerta del Cielo, por poner un ejemplo. (Estos estudios me recuerdan uno de los pocos mandamientos bíblicos citados por Bertrand Russell: no seguirás a la multitud para hacer el mal). Más estimulantes son las investigaciones que indican que las personas que adoptan actitudes impopulares en público tienen menos probabilidades de dejarse influir después por las declaraciones y acciones conformistas que las personas que manifiestan actitudes parecidas en privado.

¿Qué habría que hacer entonces para revisar las estimaciones de probabilidad de diversos acontecimientos? Una respuesta es el teorema de Bayes. Permítaseme ilustrarlo (sin ecuaciones) modificando un poco uno de esos problemas artificiales que durante décadas han atormentado a miles de estudiantes y deleitado a siete u ocho. Una mujer ve que entran intrusos en una casa de determinado pueblo, al 85 por ciento de cuya población llamaremos rosa (siguiendo una sugerencia del actor George Carlin) y al 15 por ciento restante castaño. La testigo afirma que el ladrón era castaño y las pruebas científicas dicen que, en las condiciones imperantes en el momento del robo, la testigo acierta el 80 por ciento de las veces en la identificación de los colores. Dada pues la declaración de la testigo (y suponiendo que el pueblo esté socioeconómicamente integrado), ¿qué probabilidades tiene de que haya acertado al decir que el ladrón era castaño? Muchas personas dirán que el 80 por ciento, pero la respuesta es el 41 por ciento.

La tabla de abajo aclara la situación. Supongamos que se producen 100 robos y que la mujer, como un personaje de teleserie policíaca, se las apaña para verlos todos. Si 15 ladrones son castaños y la testigo acierta el 80 por ciento de las veces, probablemente identificará a 12 (el 80 por ciento de 15) como castaños y a los 3 restantes como rosa. Además, clasificará a 68 de los 85 ladrones rosa (el 80 por ciento de 85) como rosa y a los restantes 17 como castaños. Así, de los 29 ladrones que identificaría como castaños, sólo 12 lo son en realidad. De suerte que la probabilidad condicional de que el ladrón sea castaño en vista de la declaración de la testigo de que el ladrón es castaño es, según el teorema de Bayes, 12/29, o lo que es igual, ¡el 41 por ciento!

El ladrón es en realidad castaño rosa
La testigo dice que es castaño 12 17 19
La testigo dice que es rosa 03 68 71
15 85

El teorema de Bayes nos ayuda asimismo a entender nuestra inclinación, natural pero injustificada, a sobrevalorar la probabilidad de los acontecimientos infrecuentes. A pesar de lo que se lee en la prensa, por ejemplo, los casos de hijos violados por uno de los padres son relativamente infrecuentes; a modo de ilustración, supongamos que la incidencia real es de dos niños de cada mil. Si sólo el uno por ciento de los no violados creyera recordar o informara falsamente que lo fue, y si el 50 por ciento de los realmente violados creyera recordar o informara falsamente que no lo fue, la mayoría de nosotros pensaría que se subestimaría la incidencia real de las violaciones infantiles o, por lo menos, que no se la sobrevaloraría ni un ápice. Nos equivocaríamos. A fin de facilitar la aritmética, supongamos que hacemos un sondeo entre mil personas tomadas al azar para determinar cuántas fueron violadas por sus padres. Puesto que la incidencia real (suponemos) es del dos por mil, y puesto que el 50 por ciento de los violados creerá recordar o informará falsamente que no lo fue, es probable que el sondeo nos dé al final un informe verídico. Sin embargo, el uno por ciento (es decir, unos diez) de los 998 que no fueron violados creerá recordar o informará falsamente que sí lo fue. De este modo, en el sondeo se vería que el índice de incidencia es de once niños (1 caso verdadero y 10 falsos) de cada mil, o lo que es igual, 5,5 veces el índice real del dos por mil.

También es probable que las historias vividas y ruidosas sobre estos delitos eleven, aunque sólo sea un 1 por ciento, el porcentaje de personas que las cuentan.

ΩΩΩ

Otro retal de la estadística cuya malinterpretación conduce a veces a juicios defectuosos sobre nosotros mismos y los demás es el fenómeno llamado de regresión a la media. La regresión a la media es la tendencia a que tras un valor extremo de una variable aleatoria (cuyos valores dependen de diversos factores y se apelotonan alrededor de una media) venga otro valor más próximo a la media. De personas muy inteligentes, por ejemplo, cabe esperar que tengan descendencia inteligente, pero sus hijos por lo general no serán tan inteligentes como los padres. (Puesto que el sentido sería el mismo, ¿por qué poner idiotas en vez de inteligentes suena ofensivo, como una regresión a la medianía, además de a la media?).

Una regresión a la media comparable la sufren los restaurantes que sirven comidas deliciosas durante la primera visita (y consiguen un título temporal de favoritos de mi mujer) y decepcionan durante la segunda. En este caso, la ausencia de paralelismo entre los aparentes empeoramientos y mejoras de los restaurantes difumina el fenómeno: si la primera vez nos causa una diarrea, no suele haber segundas visitas que se beneficien del regreso a la media.

Haya mejora o empeoramiento, la gente suele atribuir la regresión a la media a los actos de algún sujeto agente y no a la conducta de una variable aleatoria que depende de muchos factores. La segunda entrega de un buen disco no suele ser tan buena. La razón podría ser, no el afán de lucro de la casa musical que explota la popularidad del disco en cuestión, sino la simple regresión a la media. Del mismo modo, un atleta que tiene un año en que bate marcas podría resultar menos impresionante al año siguiente, y probablemente no porque haya aflojado el ritmo, sino a causa del regreso a la media.

Pensamos más desde el punto de vista de las historias y del empeoramiento y mejora de los héroes que desde la perspectiva estadística y los fenómenos de regresión, pero los hay que atribuirían casi todos los fenómenos a un agente (Dios, el Diablo o algún intermediario) más que al resultado de la casualidad. Hay arraigada en nosotros una parcialidad natural por las historias de conspiración y el sentido de las coincidencias, y parece que esperamos cierta combinación de ignorancia, acontecimientos y tensión para que contraigamos la temible enfermedad conceptual llamada PPP (Paranoia Provocada Probabilísticamente) que tanto prolifera a nuestro alrededor.

Nuestro punto de vista y nuestras debilidades psicológicas también desempeñan un papel cuando elegimos una entre varias alternativas basadas en su forma de presentarse. Incluso en casos matemáticamente equivalentes nos dejamos arrastrar por astutas fraseologías. Los sujetos de una investigación preferían una probabilidad del 20 por ciento de recibir 300 dólares a una probabilidad del 25 por ciento de recibir 200. Esta elección es lógica, porque el beneficio medio es de 60 dólares en el primer caso (el 20 por ciento de 300), mientras que en el segundo es de 50 (el 25 por ciento de 200). Lo que no es tan lógico es que los sujetos elijan al revés cuando las opciones se les presentan en forma de etapas.

La otra alternativa se planteó en dos etapas: con una probabilidad del 75 por ciento, el sujeto queda eliminado en la primera etapa y no recibe nada. Si alguien pasa a la segunda etapa, tiene la posibilidad de quedarse con 200 dólares en mano o con un 80 por ciento de posibilidades de recibir 300 dólares. Es lo mismo que elegir entre un 25 por ciento de posibilidades de recibir 200 dólares (dado que el 25 por ciento es el 100 por ciento menos el 75 por ciento) y el 20 por ciento de posibilidades de recibir 300 dólares (porque el 80 por ciento del 25 por ciento es el 20 por ciento). En este caso, sin embargo, la mayoría prefiere la alternativa de los 200 dólares, pensando tal vez que es más segura.

En otro estudio, los sujetos por lo general preferían percibir una ganancia segura de 800 dólares a apostar entre ganar 1000 dólares con el 85 por ciento de posibilidades y quedarse sin nada con el 15 por ciento de posibilidades. Y esto sucede aunque la segunda alternativa da 850 dólares de media. Los sujetos suelen elegir al revés cuando las mismas alternativas se presentan en forma de pérdidas. Si hay que elegir entre una pérdida segura de 800 dólares, y un 85 por ciento de posibilidades de perder 1000 dólares con un 15 por ciento de posibilidades de no perder nada, la mayoría se queda con la segunda alternativa, aunque supone una pérdida media de 850 dólares.

Hay otros guiones, muchos sobre asuntos de vida o muerte, que apoyan la afirmación de que la gente está mucho más dispuesta a arriesgarse para evitar pérdidas que para obtener ganancias. No es sorprendente que las películas y novelas sobre fugitivos en circunstancias difíciles absorban mucho más que las historias de gente rica y satisfecha que lucha por mejorar su suerte.

Aunque nos falte lucidez para entender algunos de estos rompecabezas probabilísticos, rara vez nos escasea la confianza. Si Yeats tenía razón cuando dijo que «los mejores carecen de toda convicción, mientras que los peores desbordan intensidad pasional», entonces las investigaciones de Boris Fischhoff y otros sobre el exceso de confianza sugieren que hay pocas personas admirables entre nosotros. (Vale la pena señalar que, según ciertos estudios, una de las pocas listas en las que los estudiantes de matemáticas estadounidenses ocupan el primer puesto es en la del exceso de confianza). Solemos envanecernos tanto de nuestras decisiones, acciones y convicciones porque no sabemos buscar contraejemplos, no prestamos atención a las opiniones alternativas con sus consecuencias, distorsionamos nuestros recuerdos y los indicios, y nos embriagan nuestros propios esquemas explicativos.

Esta tendencia se ve con claridad en las biografías desagradables, en las revelaciones de la prensa y en esos turbadores procesos judiciales tan frecuentes en la actualidad. Deberían presentarse con una etiqueta oficial de advertencia que declarase que la cantidad de basura descubierta sobre el tema en cuestión casi nunca es el indicador más importante de la valía de las personas implicadas. No se tiene en cuenta el significado de una operación estadística auxiliar: la razón entre la cantidad de basura desenterrada y el tiempo y los recursos empleados en abrir agujeros para encontrarla (la basura o lo que pase por tal). Mientras escribo estas líneas, las agencias de noticias informan que hasta la fecha se han gastado 30 millones de dólares en la búsqueda de presuntas fechorías de Bill y Hillary Clinton en el caso Whitewater. Yo no creo tener un grupo de amigos y conocidos particularmente infame, pero pocos saldrían indemnes de una investigación de 30 millones sobre su vida privada. (En otro capítulo volveré sobre esto del empeño con que buscamos algo y sus efectos sobre lo que encontramos).

Que estos episodios e «investigaciones» pueden influir en nuestro concepto del prójimo y de nosotros mismos lo ilustra un experimento psicológico clásico que hizo Richard Nisbett. Se habló a los sujetos de dos bomberos concretos, uno eficaz, el otro no. A la mitad de los sujetos se le dijo que el eficaz aceptaba los riesgos, mientras que el otro no. A la otra mitad se le dijo lo contrario. A continuación se les indicó que caracterizaran a los buenos bomberos en general. Cuando lo hubieron hecho, se les informó que aquellos bomberos concretos no existían, que habían sido inventados por los experimentadores. Lo curioso es que los sujetos siguieron aferrados al perfil explicativo que habían inventado por su cuenta. Si se les había dicho que el bombero eficaz era el que aceptaba los riesgos, seguían pensando que los futuros bomberos deberían elegirse según su disposición a aceptar riesgos; si se les había dicho lo contrario, seguían pensando lo contrario. Cuando se les indicó que explicaran la relación entre aceptar riesgos o no y la eficacia de un bombero, los miembros de ambos grupos dieron una explicación contundente y coherente con la fábula que se habían contado a sí mismos.

En términos más generales, tenemos tendencia a racionalizar coincidencias y anécdotas de todas clases. Nos esforzamos por darles sentido, incluso podemos llegar a abolir la grandiosa y omnipresente Ley de las Consecuencias Involuntarias (de la que la ley de Murphy es un caso particular). Las historias que creemos acaban siendo, al menos metafóricamente, parte de nosotros, y nos predisponen, quién sabe si por cierto sentido de conservación, a buscar siempre su confirmación y poquísimas veces su incumplimiento. (Estoy por decir que un rápido vistazo a nuestro alrededor lo confirmaría).

Si la gente utilizara de manera habitual una sencillísima idea procedente de la estadística, avanzaría mucho en la minimización de los cegadores efectos de esta tendencia natural y en la consolidación de un enfoque más crítico de las confirmaciones y los incumplimientos. La idea es una tabla de las llamadas de dos por dos en que se analiza la frecuencia de las cuatro relaciones posibles entre dos fenómenos cualesquiera, A y B: no sólo A y B, que es lo que primero suele llamarnos la atención, sino también A y no B, no A y B, y no A y no B. La idea es tan elemental que podría enseñarse a los niños pequeños y a los políticos profesionales.

Claves bíblicas y escándalos sexuales

Hay otra debilidad que no debería pasarse por alto. Al empeñarse en que las cosas tengan sentido, es mucho más probable que la gente atribuya un suceso a la voluntad de un agente que a la casualidad si el suceso tiene consecuencias inmediatas. En un experimento se dice a un grupo de sujetos que un hombre ha aparcado el coche en una cuesta y que el vehículo se ha ido contra una boca de incendios. A otro grupo se le dice que el coche ha atropellado y herido a un peatón. Los del primer grupo opinan en general que se trata de un accidente; los del segundo grupo es más probable que hagan responsable al conductor. Hay otros estudios que confirman que cuanto más cargado emocionalmente esté un acontecimiento o fenómeno, con más entusiasmo buscará la gente una anécdota que le dé sentido.

Esta tendencia, nuestra preferencia natural por las confirmaciones y no por los incumplimientos, y la fascinación de las coincidencias, nos ayudan a comprender el atractivo que ejercen las claves bíblicas de que hablé en la introducción.

La siguiente parodia, tibia y no muy seria, quiere arrojar luz sobre la interpretación de las probabilidades latentes en la polémica y señalar qué significan y qué no.

ΩΩΩ

La polvareda levantada por las claves que se pueden encontrar en los libros sagrados trae a la memoria un descubrimiento reciente y menos conocido, y que los abogados del presidente Clinton tuvieron oculto. ¡En el texto de la Constitución estadounidense hay codificada una profecía del escándalo Lewinsky! Puesta allí, probablemente, por los Padres Fundadores, las diez letras de los nombres Bill y Monica aparecen en serie a intervalos regulares en el reverenciado documento histórico. Con un notable parecido a ciertas claves bíblicas, los detalles no dejan de ser reveladores: las letras de Bill/Monica aparecen en orden sucesivo cada 76 letras; esto significa que, encontrada la b en determinado pasaje de la Constitución, 76 letras después vendrá la i, 76 letras después la l, y así hasta llegar a la a final de Monica, que aparecerá 76 letras después de la c. (Son las famosas SLE, series de letras equidistantes, que tanto han llamado la atención).

Tras el descubrimiento de esta serie de letras, aparentemente profética, es natural que nos preguntemos por la probabilidad de que se produzca. Si suponemos, como aproximación de principio, que las letras de la Constitución están repartidas al azar, no costará averiguar la probabilidad de ver las 10 letras de Bill/Monica en el texto de la Constitución, en cualquier serie de posiciones de 10 letras equidistantes: basta con multiplicar la probabilidad de que aparezca cada una de las diez letras de la serie. (Por ejemplo, si la probabilidad de b, en una posición dada, es de 0,14, la de i de 0,65 y la de l de 0,11, la probabilidad de que las cuatro letras de Bill aparezcan en cuatro posiciones dadas es de 0,14 × 0,65 × 0,11 × 0,11). Así pues, el producto de estas diez pequeñas cantidades (llamémoslo P) es una probabilidad realmente infinitesimal.

Como la probabilidad es microscópica, podría llegar a pensarse que la aparición de una cadena Bill/Monica en alguna serie concreta de posiciones del texto de la constitución es un acontecimiento extraordinario; pero hay que tener cuidado con la interpretación de esta extrema improbabilidad. El significado es el siguiente: si buscáramos otro texto con la misma variedad de letras que la Constitución de Estados Unidos, señaláramos una lista ordenada de diez posiciones de letras y comprobáramos si las letras de Bill/Monica estaban en las posiciones señaladas, la probabilidad de que estuvieran sería P.

Sin embargo, este procedimiento no refleja el método del descubrimiento de la serie Bill/Monica en el texto constitucional. En nuestro cálculo de probabilidades suponíamos que la serie de letras y las posiciones se habían concretado de antemano, y que el texto se seleccionó y escrutó después. En el descubrimiento de la codificación constitucional, lo primero que se produjo fue la observación, es decir, que la serie de las letras de Bill/Monica la descubrió en el documento, qué sé yo, algún sabio, ducho en informática, dentro de algún gabinete de ideas próximo al Potomac. Una vez que se encontró la serie, la cuestión de la probabilidad de su aparición pasó a ser trivial.

No menos notable es que la SLE de Bill/Monica no necesita aparecer en un lugar concreto de la Constitución. No nos preocupa que la serie empiece, por ejemplo, en la letra número 14.968; más bien buscamos que la serie empiece en cualquier lugar del texto, lo cual significa que miramos todas las diferentes posiciones de letras en que puede comenzar la serie de intervalos de 76 letras (supongamos que en la constitución hay X posiciones de letras) para ver si encontramos al menos un caso. La probabilidad de ver la serie Bill/Monica es mucho mayor por este procedimiento, aproximadamente igual a P × X.

Supongamos ahora que no buscamos sólo un intervalo de 76 entre las letras de Bill y Monica, sino la pauta de todos los intervalos posibles, por ejemplo entre 1 y 1000, comenzando por cualquier punto del texto constitucional. Con este procedimiento los números vuelven a cambiar. La probabilidad de que veamos la pauta Bill/Monica es aproximadamente igual a P × X × 1000, y esta cantidad ya no es tan pequeña.

Podemos aumentar la probabilidad de hallazgos de estas series ampliando la cantidad de formas de aparición. Se permiten las búsquedas hacia atrás y en diagonal, incluso (como en las claves bíblicas) que diferentes SLE de Bill y Monica estén próximas pero separadas, y también buscar otros nombres del presidente y de su(s) amante(s), y flexibilizar las normas de múltiples maneras.

Si la búsqueda de estas series no se hace abiertamente y si se descartan los casos en que no se encuentra nada significativo (por ejemplo, SLE cercanos de calabacín y tenis), y si sólo hacemos públicas las series interesantes que encontramos, y calculamos las probabilidades de manera simplista, está claro entonces que esas series no significan lo que podría parecer que significan a primera vista. Aplicar un método por un lado y calcular una probabilidad asociada con otro método no es legal, por decirlo suavemente.

Casi todas las claves bíblicas (judías, cristianas, islámicas, o de fuentes modernas, utilicen la Cábala o a Monica) tienen defectos vagamente parecidos a los de las claves constitucionales.[7] El artículo sobre estadística que se mencionó en la Introducción también podría ayudarnos a comprender un defecto distinto y más sutil, que tiene que ver con los prejuicios involuntarios a la hora de elegir series de interés público, con los métodos mal definidos, con la variedad y las contingencias de la ortografía y las referencias del hebreo antiguo, y con el teorema de Ramsey (del que hablaremos en otro capítulo), una categórica demostración matemática de la inevitabilidad del orden en cualquier cadena de símbolos lo bastante larga. En realidad, el artículo se publicó por esto último, no porque se tuviera fe en las profecías cifradas. El sentido común pone de manifiesto la insensatez de basar opiniones políticas, espirituales o sexuales en estas rarezas numerológicas descontextualizadas.

ΩΩΩ

Las claves bíblicas no son más que una de las últimas expresiones de nuestra tendencia natural a dar significado a las coincidencias. En El hombre anumérico y en Un matemático lee el periódico he hablado de la apabullante insignificancia de la inmensa mayoría de coincidencias. Que dos personas de un grupo cumplan años el mismo día, por ejemplo, es muy probable si el grupo es de 30 personas o más. Si es de 23 personas, la probabilidad de que haya al menos dos personas que nacieran el mismo día del año es de 1/2. Y si se elige al azar a dos personas, A y B, mirando en las guías telefónicas de todo el país, la probabilidad de que estén vinculadas por dos personas intermedias es aplastante; quiero decir que A conozca a uno que conozca a otro que conozca a B (aunque A y B no estén al tanto de la mediación). Hay listas de similitudes, aparentemente siniestras, entre los presidentes Lincoln y Kennedy. Digo «aparentemente» porque hay listas igual de largas que relacionan asimismo a los presidentes McKinley y Garfield. Las iniciales de los planetas, según su distancia del Sol, dan MVTMJSUNP (aparece sun, «sol» en inglés). Las iniciales de los meses también incluyen un nombre: EFMAMJJASOND. Que algunas predicciones que hacen los astrólogos resulten acertadas es lo menos que se puede esperar si nos basamos en las probabilidades. Etcétera, etcétera, etcétera.

Las coincidencias de alcance mundial suelen denominarse milagros, siempre que el resultado sea bueno. (No se suele llamar milagro al terremoto inesperado que derriba un edificio el único día del año que está lleno de párvulos). Como en el caso de las versiones más normales, la inmensa mayoría de los «milagros» carece de sentido; algunos ponen de manifiesto conexiones valiosas que sin embargo se han descuidado; y unos cuantos sugieren una laguna en nuestros conocimientos. Se tiene muy poco en cuenta lo que dijo David Hume sobre esta última variedad de milagros. Hume señaló que todas las pruebas de que ha habido una coincidencia milagrosa (es decir, una violación de las leyes naturales) son igualmente pruebas de que las reglas que ha contravenido el supuesto milagro no son a la postre leyes naturales.

La coincidencia más aterradora de todas sería la ausencia total de coincidencias. Con esto no hago sino formular de otro modo el meollo del mencionado teorema del matemático inglés Frank Ramsey y sus herederos intelectuales (repito estos detalles a pesar de que la reiteración de las frases huecas se tolera mejor que la repetición de su desenmascaramiento, que por lo general se toma como reproche y en serio).

Una consecuencia de la errónea convicción de que las casualidades son fenómenos especiales y casi siempre significativos es su escasez en la literatura moderna, donde se consideran una especie de truco barato. Estamos muy lejos de los novelistas Victorianos, que solían introducir en sus obras coincidencias descabelladas. Si Charlotte Brontë alargaba el largo brazo de la casualidad hasta el extremo de descoyuntarlo, como se ha señalado en alguna ocasión, la mayoría de los autores modernos lo han reducido a un muñón antinatural incapaz de llegar a ningún sitio. Las casualidades y coincidencias son el omnipresente condimento de la vida, y eliminarlas de las novelas y las películas aumenta el determinismo de la trama y de los personajes y reduce su naturalidad.

Algunas formas modernas de literatura quieren reflejar conscientemente la naturaleza aleatoria de la vida y estas obras, con flujo de conciencia, fragmentarias y semejantes a collages, contienen, como los periódicos, muchas casualidades. En las novelas cómicas hay mucha más tolerancia para las casualidades, en parte por las situaciones que generan. Esta mayor tolerancia también podría ser un reflejo de la actitud de los autores cómicos, más indiferentes y más dispuestos a descontextualizar los acontecimientos de la vida de los personajes y a destacar su conexión casual. (La licitud de trasladar acontecimientos de un contexto a otro varía mucho según la disciplina, como veremos en el capítulo siguiente. En probabilidad y matemáticas se permite, por lo general, la sustitución de iguales por iguales; en las historias, sobre todo las contadas en primera persona, la sustitución suele ser desaconsejable).

Sentimos a gusto con la insignificancia de la mayoría de casualidades y coincidencias o empeñamos en encontrar siempre un Sentido detrás de ellas es, a la postre, un aspecto importante y revelador de nuestra personalidad y nuestra idea del mundo.

Cuento con truco y apareamiento probabilístico

Algunas coincidencias son significativas, pero no por razones evidentes. Un truco de magia de reciente factura ilustra muy bien cómo dos personas pueden «aparearse cognitivamente» y generar una fusión casual, por lo demás difícil de explicar. El ejemplo también es aplicable a las claves bíblicas.

Es un truco de cartas y lo inventó hace unos quince años el matemático Martin Kruskal; se explica mejor si se eliminan las figuras de la baraja. Imaginemos a dos jugadores, Embaucado y Embaucador. Embaucador dice a Embaucado que piense en un número, por ejemplo X, entre el 1 y el 10, y luego le dice que se fije en la carta número X mientras Embaucador vuelve los naipes uno por uno, muy despacio, y los pone en un montón informal. Cuando se llega a la carta número X (pongamos que es un Y), el número que aparece en Y pasa a ser el nuevo número secreto de Embaucado, y Embaucador le dice entonces que se fije en la carta número Y mientras sigue volviendo los naipes uno por uno. Cuando aparece la carta número Y, su valor (Z, por ejemplo) es otra vez el número secreto de Embaucado, y nuevamente se le dice que se fije en la carta número Z, y así sucesivamente.

Si el primer número secreto de Embaucado es un 7, se fijará en la séptima carta que vuelva Embaucador. Si esta séptima carta es un 5, éste será el nuevo número secreto de Embaucado, que tendrá que fijarse ahora en la quinta carta que le enseñen. Si la carta quinta es un 10, el 10 será el nuevo número secreto de Embaucado, que se fijará a continuación en la décima carta que vuelva Embaucador. Cuando la baraja está a punto de agotarse, Embaucador vuelve una carta y dice: «Tu nuevo número secreto», y casi siempre acierta. Las cartas no están marcadas ni en un orden especial, no hay compinches cerca, no hay juegos de manos y Embaucador no está muy al tanto de las reacciones de Embaucado ante las cartas que le va enseñando. ¿Cómo lo consigue?

La solución es muy buena. Al comienzo del truco, Embaucador piensa en un número secreto propio. Sigue las mismas instrucciones que da a Embaucado. Si piensa en un 3, se fija en la tercera carta y memoriza su valor, por ejemplo un 9, que pasa a ser su nuevo número secreto. Se fija a continuación en la carta novena, por ejemplo un 4, y éste será entonces su nuevo número secreto.

Aunque haya una sola posibilidad entre diez de que el número secreto de Embaucador y Embaucado sea el mismo, no cuesta admitir, y puede demostrarse, que antes o después coincidirán ambos números. Si se eligen dos o menos series aleatorias de números entre el 1 y el 10, antes o después, por pura y simple casualidad, conducirán a la misma carta. Además, a partir de este punto, los números secretos serán idénticos, porque tanto Embaucador como Embaucado siguen la misma regla de generar números nuevos basándose en los anteriores. Embaucador se limita a esperar hasta que llega casi al final de la baraja, y entonces vuelve la carta correspondiente a su último número secreto, convencido de que a estas alturas será también el número secreto de Embaucado.

Al margen del placer que produce comprenderlo, ¿no tiene este truco algunos equivalentes en el mundo real? Téngase en cuenta que el truco funciona igual de bien con más de un Embaucado e incluso sin ningún Embaucador (siempre que alguien vuelva las cartas una por una). Si hay muchas personas, cada una piensa en un número inicial y va generando otros de acuerdo con el procedimiento descrito, llegará un momento en que todos tendrán el mismo número secreto y desde entonces y hasta que se acabe la baraja avanzarán al mismo ritmo.

Si dejamos que el nuevo número secreto de los participantes se determine de un modo más complicado, partiendo por ejemplo de varios números secretos anteriores y no del precedente inmediato, y si cambiamos la película de pasar las cartas por otra actividad serial y numérica como la lotería o el mercado de valores, veremos desarrollarse por sí solo el potencial de la conducta isorrítmica a gran escala. Si son muchos los inversores que utilizan, por ejemplo, el mismo programa informático (es decir, las mismas reglas para determinar cuándo comprar o vender), es lógico que aparezca alguna variante menor en la conducta isorrítmica a gran escala, sea cual fuere la posición inicial de los inversores.

Propongo el siguiente camelo religioso. Pensemos en un libro sagrado con una propiedad muy atractiva, que se elija la palabra que se eligiere en las páginas de la primera parte, conduzca siempre, de acuerdo con las instrucciones que voy a describir, a la misma palabra dramática y especialmente sagrada. El lector puede comenzar por cualquier palabra que le guste; cuente sus letras (pongamos que tiene X); cuente palabras a partir de aquí y vaya a la palabra número X; cuente las letras de esta nueva palabra (pongamos que tiene Y); cuente Y palabras para llegar a otro término; cuente sus letras (pongamos que tiene Z); el lector seguirá este método hasta llegar a la palabra dramática y especialmente sagrada. No cuesta imaginar lo que seguiría, una febril aplicación del método, comprobando una tras otra las palabras de la primera parte del libro sagrado, y la creciente convicción de que la inspiración divina es la única explicación posible del fenómeno. Si la regla generatriz fuera más complicada que la de este sencillo ejemplo, el efecto sería más misterioso aún.

Teorema de Bayes y revisión de las propias historias

Todos, de un modo informal, valoramos diariamente las probabilidades, y casi todos, individualmente o en colaboración con otros, solemos revisar esas valoraciones. Antes de pasar a su revisión, sin embargo, quisiera decir algo sobre la definición de probabilidad.

Por desgracia, hay aún mucha polémica sobre su significado. Para unos es una relación lógica, como si se pudiera echar un vistazo a un dado, tomar nota de su simetría y llegar por pura lógica a la conclusión de que la probabilidad de que salga un 3 es de 1/6. Para otros, la clave del análisis es la frecuencia relativa, siendo la probabilidad de un suceso una forma abreviada de indicar el porcentaje a largo plazo de las veces que se produce, aunque lo de «a largo plazo» suele dejarse sin explicar. Otros aún sugieren que la probabilidad es cuestión de convicción personal y que no es sino una expresión de la opinión que se alimenta de historias plausibles y de experiencias diarias.

Aunque el debate continúa, los matemáticos, como todos los generales derrotados, se han retirado y cantado victoria al mismo tiempo. Han visto que en todas las definiciones admisibles la probabilidad termina poseyendo ciertas propiedades formales, de manera que podría definirse diciendo simplemente que es cualquier cosa que satisfaga esas propiedades. Una definición así puede que no sea filosóficamente grata, pero es matemáticamente liberadora y sirve para poner un mínimo de consenso entre las distintas versiones de la idea.

Las propiedades que según todas las definiciones parece tener la probabilidad las reunió el matemático ruso A. N. Kolmogorov, y pueden resumirse como sigue: la probabilidad de que se produzca un suceso, cuantificada por un número entre 0 y 1 (o lo que es igual, por un porcentaje entre 0 por ciento y 100 por ciento), debería ser igual a 1 (100 por ciento) menos la probabilidad de que el suceso no ocurra. La probabilidad de que ocurra uno entre varios sucesos mutuamente excluyentes (por ejemplo, que salga un 1 o un 3 o un 5 a los dados) es el resultado de sumar las probabilidades de cada suceso (1/6 + 1/6 + 1/6). La probabilidad de que ocurran varios sucesos independientes es el producto de sus probabilidades respectivas. Este libro no trata de estas ni de otras propiedades o axiomas, pero me gustaría analizar una consecuencia importante.

Las probabilidades condicionales son probabilidades que dependen de ciertos datos. Supongamos que la probabilidad de que un adulto elegido al azar pese menos de 60 kilos es del 25 por ciento. La probabilidad condicional de que alguien pese menos de 60 kilos midiendo 1,90 es, me parece a mí, muy inferior al 5 por ciento. Fijémonos además en que la probabilidad condicional de que una persona hable español teniendo la ciudadanía española es, pongamos, del 95 por ciento, mientras que la probabilidad condicional de que una persona que habla español sea además española es posible que sea inferior al 10 por ciento.

El teorema de Bayes es una fórmula que nos dice cómo modificar nuestras probabilidades condicionales, a veces subjetivas, y por tanto, de manera indirecta, cómo corregir las historias que les dan contexto y significado. La red de probabilidades condicionales que cada cual asigna por cuestiones personales a multitud de sucesos e hipótesis es muy intrincada. Nos diferenciamos en nuestra forma de asignar probabilidades generalizadas a los acontecimientos y nos diferenciamos más aún en las probabilidades que damos a las asociaciones entre sucesos.

Esta confusa red de valoraciones de probabilidades, de inclinaciones y de convicciones es, en cierto modo, un mapa de nuestra mente y está en interrelación continua con experiencias nuevas y las viejas historias que no cesamos de corregir. Esta red depende asimismo, como veremos en el capítulo siguiente, de la valoración de probabilidades que hacen otras personas, de sus inclinaciones y de sus convicciones. La revisión de nuestras probabilidades condicionales subjetivas suele conducir nuestro punto de vista (por muy ilógico y personalísimo que sea) a un diálogo más provechoso con los datos nuevos, más objetivos. Así, a pesar de nuestra inmunidad ocasional a los hechos, las probabilidades condicionales son vínculos decisivos entre el mundo impersonal y las historias que nos contamos sobre nosotros y sobre los demás.

¿Qué es el teorema de Bayes? Aunque cada cual lo emplea tácitamente al revisar su valoración de probabilidades, sólo los estadísticos suelen emplear su versión formal. Para que quede claro, y sin notación formal, el teorema de Bayes afirma que la probabilidad condicional de una hipótesis ante un dato nuevo es igual al producto de (a) la probabilidad de la hipótesis antes del dato y (b) la probabilidad condicional del dato con la hipótesis, partido por (c) la probabilidad del nuevo dato. La fórmula y su derivación importan poco aquí, porque a menudo es mejor construir tablas (como en el ejemplo del ladrón de casas) que derivar la fórmula o emplearla. Lo que interesa es que el teorema de Bayes nos da un método para incorporar información objetiva nueva en nuestras opiniones subjetivas y personalizadas. Por desgracia, conduce a veces a resultados correctos aunque aparentemente absurdos, sobre todo en situaciones ligadas a hechos aislados o infrecuentes.

Otro problema relacionado con el teorema de Bayes es que las probabilidades de la vida real se pueden incrustar de múltiples maneras en incontables historias y argumentos, y que los datos nuevos, en consecuencia, se pueden filtrar y multiplicar en la máquina de revisión de probabilidades de Bayes, también de múltiples (y a veces inconmensurables) formas. Las historias cotidianas son siempre confusas y polifacéticas. Por ejemplo, entre las personas que saben que los últimos cinco clientes de cierto abogado fueron condenados, unas podrían revisar hacia abajo la valoración de sus probabilidades de obtener la absolución, en el caso de que lo contraten; otras, que dan más peso al hecho de que todos los clientes eran ricos y de distintas partes del país, podrían ver al abogado como a un paladín de la justicia que sólo acepta los casos más difíciles y en consecuencia revisar su valoración hacia arriba.

Unos cuantos casos con más matices ilustrarán mejor el asunto.

Historias jurídicas complejas y redes de inferencia

La relación entre la probabilidad y la ley es inestable. La probabilidad cuantificable y la plausibilidad cualitativa, a pesar del teorema de Bayes, no siempre se conciben; adjudicar un valor numérico a un argumento convincente suele ser una majadería. Los probabilistas son a veces reduccionistas e intransigentes con las sutilezas y salvaguardas de la ley, y también hay abogados anuméricos o que desdeñan las enseñanzas de la probabilidad. No obstante, los dos campos contienen buenos ejemplos de ideas tomadas del otro. La proposición que se rechaza sólo cuando es muy improbable, la hipótesis nula de la práctica estadística, está muy bien expuesta en la presunción de inocencia que establece la ley.

Ciertos juicios recientes cuya transcripción ocupa miles de páginas podrían aclararse (para los curiosos interesados, y hasta para los jurados) si el argumento se expusiera en una gráfica. En ella estarían, organizados y lógicamente encadenados, las distintas pruebas y los pasos deductivos que han conducido a la declaración de culpabilidad. Cada paso del argumento tendría además su propia cadena subsidiaria de indicios (obtenidos en los segundos y terceros turnos de preguntas a los testigos) que lo confirman o lo desmienten. Algunos pasos de las cadenas subsidiarias tendrían a su vez cadenas filiales propias para confirmarlos o desmentirlos. (Los tres diagramas mencionados en el capítulo anterior vienen aquí al caso). Ahora bien, si los jurados pudieran asignar probabilidades elementales a las pruebas y a los testimonios, una reiterada aplicación de las leyes de la probabilidad, en particular el teorema de Bayes, daría la probabilidad de que se emitiera un fallo general de culpabilidad. Si esta probabilidad general no fuera lo bastante alta, se declararía inocente al acusado.

Este método, expuesto aquí de un modo esquemático, se debe a John H. Wigmore, antiguo decano de la Facultad de Derecho de la Northwestern University (Evanston, Illinois), que lo explicó en Judicial proof: as given by logic, psychologic, and general experience and illustrated in judicial trials, publicado en 1937. Joseph Kadane y David A. Schum lo aplican a gran escala en A probabilistic analysis of the Sacco and Vanzetti evidence.

Las probabilidades que los jurados o los curiosos atribuyen a la veracidad, la objetividad y la sensatez observadora de los testigos varían de acuerdo con sus opiniones y su experiencia de la vida. Unos son veraces pero cortos. Otros acusan influencias pero son agudos. Las probabilidades que los jurados asignan a la credibilidad, pertinencia y peso de las pruebas varían por las mismas razones. Una prueba puede ser indiscutible pero irrelevante. Otra podría ser muy pertinente, pero cuestionable. Distinguir estas características es esencial al determinar las probabilidades. Hay probabilidades que pueden ser más o menos constantes para todos los observadores; la probabilidad de que el asesino estuviera en el escenario del crimen, por ejemplo, será 1 por unanimidad. Distintas historias crearán distintas vinculaciones entre la declaración de los testigos y las pruebas materiales.

En las valoraciones de probabilidad, además de las variaciones de cada individuo, influyen igualmente los engaños y espejismos de que ya hablé y a los que todos estamos sujetos. Ciertos estudios han demostrado, por ejemplo, que en general se considera mucho más temerario un acto que elevó de 0 entre 1000 a 1 entre 1000 las posibilidades de un accidente que otro acto (cometido por otro acusado) que elevó de 5 entre 1000 a 6 entre 1000 las posibilidades de un accidente, más incluso que otro que elevó la probabilidad de 5 entre 1000 a 10 entre 1000.

Los elementos tocantes a las pruebas, las probabilidades y los testimonios de los juicios complicados son tan intrincados y abstrusos que llegan a ser muy útiles los medios artificiales de organizar la información y de hacer deducciones coherentes de ella. Estos medios pueden tener la forma de gráficas manuales de Wigmore (descritas formalmente en el libro de Wigmore) o de programas informáticos (como ERGO) diseñados expresamente para navegar por estas autopistas de la deducción. Repito que los jurados y los no jurados pueden asignar las probabilidades que quieran a las pruebas, los testimonios y las asociaciones que hubiere en las distintas y discrepantes versiones del delito. Las gráficas o el programa se limitan a decir que las asignaciones tal vez absurdas y los veredictos derivados de ellas serán incoherentes; otra cosa no garantizarán, pero eso sí.

O. J. Simpson y el estadisticidio

Los lectores masoquistas tal vez quieran ojear las macizas gráficas de Wigmore que se necesitan para cartografiar el caso de O. J. Simpson, que está algo más que tangencialmente emparentado con el teorema de Bayes, las casualidades y las relaciones entre puntos de vista individuales y normas sociales. Lo que sigue lo he tomado de un artículo de opinión que escribí para el Philadelphia Inquirer después del primer veredicto:

«Además de la desagradable sensación producida por el folletín Simpson, ha habido muchos ejemplos de lo que podríamos llamar estadisticidio. Permítaseme empezar por un estribillo repetido continuamente durante el proceso por el letrado Alan Dershowitz. Este hombre afirmaba que, puesto que menos del uno por mil de las mujeres maltratadas por sus compañeros mueren a manos de éstos, los malos tratos producidos en el matrimonio Simpson no tenían que ver con el caso. Aunque las cifras son correctas, las palabras del señor Dershowitz son de una incongruencia apabullante; no tienen en cuenta un hecho ineludible: Nicole Simpson murió de muerte violenta. Dadas ciertas suposiciones fácticas razonables de homicidio y malos tratos conyugales, se puede ver fácilmente, empleando el teorema de Bayes, que si un hombre maltrata a su mujer o novia y ésta muere asesinada después, el vapuleador es el homicida más del 80 por ciento de las veces (Jon Merz y Jonathan Caulkins lo expusieron muy bien en un número reciente de la revista Chance). Así pues, estaba matemáticamente justificado, a falta de otros indicios, que la policía sospechara inmediatamente del señor Simpson. No estoy defendiendo en modo alguno la derogación de los derechos de nuestra cuarta enmienda; me limito a puntualizar que señalar con el dedo al señor Simpson no era, tal como estaban las cosas, ilógico, ni fue una muestra de racismo».

La independencia estadística es otra idea matemática que habría podido utilizarse más incisivamente durante el proceso. Como ya expliqué, dos sucesos son estadísticamente independientes si la ocurrencia de uno no afecta a la probabilidad de la ocurrencia del otro. Además, cuando dos sucesos son independientes (por ejemplo, múltiples lanzamientos de una moneda), la probabilidad de que se produzcan los dos no es más que el producto de sus probabilidades respectivas.

Si las diversas pruebas incriminadoras fuesen manifestaciones independientes (y muchas lo eran), para saber la probabilidad de que aparecieran todas habría que multiplicar sus probabilidades respectivas. Olvidémonos por el momento del ADN y pensemos sólo en la probabilidad de dos sencillos hallazgos materiales. ¿Qué probabilidad había de que las pisadas del asesino que salían del escenario del crimen fueran de la talla 46 que calza el señor Simpson? ¿Y cuál era la probabilidad de que el señor Simpson recibiera un corte en el costado izquierdo la misma noche que el homicida (a juzgar por las manchas de sangre que había a la izquierda de las pisadas)? La valoración de estas probabilidades puede variar, pero seamos generosos y digamos que eran 1 entre 15 y 1 entre 1000 respectivamente. La probabilidad de que ambas pruebas independientes apareciesen es el producto de sus probabilidades, 1 entre 15.000, un fuerte indicador de culpabilidad totalmente al margen del irrefutable testimonio del ADN. Cuantas más pruebas añadamos al montón, más se reducirá esta minúscula probabilidad.

La independencia desempeñó asimismo cierto papel en el testimonio del ADN. Se habló entonces de una probabilidad inferior a 1 entre 5700 millones, la población mundial, y muchos lo consideraron automáticamente un ejemplo de exageración típica de la acusación. Pero la población mundial no tiene nada que ver con el asunto. Puesto que hay muchísimos más genomas en potencia (como también muchísimas más combinaciones de bridge) que personas en el mundo, no es insensato afirmar que la probabilidad de que una persona tenga determinada cadena genética (o mano de bridge) es 1 entre 75.000 millones (o 1 entre 600.000 millones en el caso del bridge). Estas probabilidades ínfimas son resultado de multiplicar muchas probabilidades pequeñas.

Como es lógico, también pueden elaborarse argumentos probabilísticos exculpatorios. Podría replicarse, por ejemplo, diciendo que en el juicio lo importante no era la probabilidad de que una persona inocente tuviera todas las pruebas en contra, sino la probabilidad de que una persona con todas las pruebas en contra fuera inocente, que es muy distinto.[8] En el caso Simpson, sin embargo, no es una réplica muy prometedora, por eso la defensa se aferró a su teoría de la conspiración y la tapadera. No es posible adjudicar una probabilidad exacta a esta película, pero aceptarla invita a creer que la obtusa policía que no hizo caso de ninguna de las llamadas de auxilio de Nicole Simpson es la misma que, al averiguar que la habían matado, automáticamente y sin recibir instrucciones ideó una trampa complicada para enredar al señor Simpson. Los agentes de policía, los técnicos de laboratorio y los expertos en criminología (sobre los que, con una sola excepción, no se presentó ninguna prueba de corrupción) habrían tenido que estar compinchados en una compleja red de malas intenciones.

¿Habría servido de algo en el juicio una gráfica de Wigmore, habida cuenta de la inevitable complicación del diagrama? Los jurados, al parecer, dan un valor desproporcionado a unas pruebas (el guante que no encaja) y prácticamente pasan otras por alto (las manchas de sangre). Sin embargo, al obligar a la coherencia interna, una gráfica así tal vez habría estimulado una deliberación más sistemática. Podría decir más cosas, pero muchos piensan que las estadísticas son aburridas y que cualquiera podría cometer un estadisticidio. Cualquiera podría, pero no cuando significa disculpar un homicidio. Tiene que haber algún acuerdo entre las historias que nos atraen y las probabilidades.

ΩΩΩ

A veces, los puntos de vista personales y las probabilidades objetivas tienen una relación conflictiva que se parece a la que hay entre el discurso informal y la lógica formal. Las aplicaciones de la probabilidad y la estadística exigen una historia, un contexto o un argumento para que tenga sentido. Pero como veremos en el capítulo siguiente, la lógica de las historias, las conversaciones cotidianas y los argumentos informales no siempre son compatibles con la lógica formal de la ciencia, las matemáticas y la estadística.