1
Entre las historias y las estadísticas

—¡Está a punto de surgir un isótopo de bismuto! —exclamé atropelladamente, viendo cómo salían despedidos del crisol de una supernova los elementos recién nacidos.

—¡Y que lo digas!

Italo Calvino

¿Historias y estadísticas? ¿A qué podría referirse esta yuxtaposición de términos? ¿A la cantidad de libros históricos que se publican al año? ¿A las anécdotas que cuentan los encuestadores? ¿A las biografías de Harris, Field, Gallup y Yankelovich? Si se insistiera, la mayoría diría seguramente algo desdeñoso, por ejemplo que las historias y las estadísticas se parecen tanto como un guisante a un elefante o, por no desperdiciar la rima, como una tortuga a una lechuga; el presente libro, sin embargo, la considera seriamente.

Uno de los supuestos de que parte es que las historias y el discurso informal han dado origen, con el tiempo, a dos modos complementarios de pensamiento que se emplean por lo general en estadística, lógica y matemáticas. Aunque estas disciplinas son quizá más difíciles de abordar y pueden incluso ir contra nuestras intuiciones, puede afirmarse que primero contamos historias y luego, en el parpadeo de un eón, hablamos de estadísticas.

Hay otros binomios «obstétricos» que se parecen un poco a éste: lo particular y lo general, lo subjetivo y lo universal, la intuición y la prueba, la emoción dramática y lo intemporal, la primera persona y la tercera, lo extraordinario y lo canónico. El primer elemento de cada binomio, aunque pudiera considerarse inferior, da origen al segundo o abona su terreno. Un sentimiento subjetivo es un preámbulo necesario para la valoración de la universalidad, y la inmersión emocional en el momento tiende poco a poco a la conciencia de lo intemporal.

Meditar estas oposiciones con naturalidad sugiere que el abismo que las separa es más cuestión de tradición, grado y terminología que de profundidades insondables. Creo que es así; y dado que la sima entre historias y estadísticas es una sinécdoque del más conocido abismo entre las dos culturas que distinguió C. P. Snow, la literaria y la científica, algunos temas que trato tienen un alcance mayor de lo que pueda pensarse cuando surjan. (En ocasiones emplearé el término estadística en un sentido muy general). Sinécdoque es un término literario que designa una figura de dicción en que se toma la parte por el todo, y viceversa, y esto es lo que ocurre cuando se toma una muestra por toda la población. Con este detalle de pedantería tenemos ya tendido el primer cordel sobre el abismo.

Atisbos primitivos

Las ideas de probabilidad y estadística no aparecieron de repente, con todo el aparato con que las vemos en los cursos de matemáticas. En la antigüedad ya se atisbaron los conceptos de media y variabilidad. Los huesos y las piedras se empleaban para jugar a los dados. En la literatura antigua hay referencias a la probabilidad. La importancia del azar en la vida cotidiana se entendía claramente, por lo menos la entendían algunos. No es difícil imaginar pensamientos probabilísticos revoloteando en la mente de nuestros antepasados. (Con un poco de suerte habré vuelto antes de que se lo coman todo; es poco creíble que dejaran intacto el ganado y se llevaran su cosecha de bellotas; él suele exagerar su número de presas).

Las ideas de azar y probabilidad se formalizaron milenios después, cuando Pascal y Fermat las perfeccionaron para resolver ciertos problemas de juego allá por el siglo XVII. Laplace y Gauss, ciento cincuenta años más tarde, las desarrollaron y aplicaron a cuestiones científicas; y Quetelet y Durkheim las emplearon en el siglo XIX para comprender las regularidades de los fenómenos sociales. (Hay más posibilidades de sacar un seis tirando un solo dado cuatro veces que de sacar dos seises tirando dos dados veinticuatro veces; la probabilidad de que una partícula se desintegre en el próximo minuto es de 0,927; las encuestas realizadas en los colegios electorales revelan que cuatro de cada cinco ciudadanos a favor de la ley de control de armas dieron su voto a Gore).

Después de este rápido viaje por la historia de la estadística, permítaseme reducir la velocidad para señalar algunos de los muchos antepasados corrientes de las ideas más sobresalientes sobre probabilidad y estadística. Pensemos en primer lugar en las nociones de tendencia centralizadora: media, mediana, clase modal, etcétera. Lo más seguro es que surgieran de palabras cotidianas como habitual, acostumbrado, típico, mismo, regular, mayoría, clásico, estereotipo, esperado, vulgar, normal, corriente, medio, convencional, tópico, mediano. Cuesta imaginar a los prehistóricos, incluso a los que carecían del vocabulario descrito, sin algún barrunto de lo típico. Es de creer que fenómenos o seres como las tormentas, los animales y las piedras que se presentasen una y otra vez condujeran de manera natural a la idea de recurrencia típica o media.

Veamos también las precursoras de las ideas de variación estadística: desviación estándar, varianza, etcétera. Se trata de insólito, peculiar, extraño, singular, original, extremo, especial, diferente, único, anormal, distinto, dispar, raro, demasiado, etcétera. Una expresión como fuera de lo común, que indica algo extraordinario, viene muy al caso, porque una observación que está en la «cola» de la gráfica de una distribución estadística está fuera de lo habitual y señala una gran desviación de la magnitud en cuestión. Con el tiempo, cualquier situación o entidad que se repita sugerirá la idea de excepción. Si unos acontecimientos son corrientes, otros son raros.

La probabilidad está implícita en palabras como casualidad, acaso, posibilidad, destino, dioses, hado, fortuna, suerte, coincidencia, azar y muchas otras. Adviértase que la sola admisión de la idea de posibilidades alternativas, esencial para la narrativa, casi supone la idea de probabilidad; unos argumentos se considerarán más probables que otros. La necesidad de destacar aspectos de situaciones y entidades repetitivas conduce igualmente al concepto de muestreo, clave en estadística, y que se refleja en palabras y expresiones como ejemplo, caso, representativo, observación, espécimen y muestra. Del mismo modo, el proceso mental natural de asociar dos animales o cosas sugiere la importante idea de correlación, que tiene los siguientes correlativos (por así decirlo): asociación, conexión, relación, vinculación, conjunción, conformidad, dependencia, proporción y la siempre predispuesta causa.

Como R. P. Cuzzort y James Vrettos expusieron en The elementary forms of statistical reason, incluso nociones estadísticas menos conocidas como control, estandarización, comprobación de hipótesis, análisis bayesiano (la revisión de las estimaciones de probabilidad a la luz de nuevos datos) y categorización, se corresponden con ideas y locuciones de sentido común que son parte inseparable del saber humano y de la literatura. A semejanza de aquel personaje de Molière que se queda de una pieza cuando se entera de que ha estado hablando en prosa toda la vida, muchas personas se asombran cuando se les dice que buena parte de lo que consideran sentido común es estadística o, en términos más generales, matemáticas. No deja de ser revelador que la palabra contar se refiera igualmente a los números y a las historias.

Se quiera o no, todos somos estadísticos, como cuando hacemos inferencias a lo grande sobre una persona basándonos en esa diminuta muestra del comportamiento que se llama primera impresión. La diferencia entre la estadística matemática y la variedad doméstica suele estar sólo en el grado de formalización y rigor objetivo. La desviación estándar se mide de acuerdo con reglas y definiciones concretas, igual que los coeficientes de correlación, la estadística de rangos, los valores chi-cuadrado y los promedios (qué significan estas expresiones importa poco aquí, aunque sostengo que se pueden explicar con anécdotas y situaciones corrientes); sus parientes de la calle no están tan formalizados.

También debe haber límites para el uso cotidiano de estas expresiones. El cómico Steven Wright tiene un «gag» en el que entra en una tienda de ropa y pide al dependiente una camisa de tamaño «extramediano». He pirateado esta ocurrencia en algunas ocasiones (por lo general en heladerías) y he averiguado que tiende a producir una confusión temporal, un indicio de que la gente se da cuenta de que las propiedades formales de lo mediano hacen que la expresión resulte extraincongruente. Asimismo, la gente entiende la ironía de Garrison Keillor cuando dice que casi todo el mundo está por encima de la media; o la de los recientes titulares de un periódico de Virginia Occidental, que decían: «El desempleo sigue subiendo, pero a una tasa más baja que nunca». Comentarios huecos como «Los sondeos revelan que algunos votantes apoyan la iniciativa», que he oído hace poco en una emisora de radio local, nos dan otro ejemplo: es lo que ocurre siempre, salvo cuando las iniciativas resultan detestables para todos.

Laplace, el gran astrónomo y matemático francés, escribió: «La teoría de probabilidades no es en el fondo más que el sentido común reducido al cálculo». Voltaire, contemporáneo suyo y mucho más viejo, añadió: «El sentido común es el menos común de los sentidos».

Las historias como contexto estadístico

Por desgracia, las personas no suelen reparar en las conexiones entre las ideas formales de la estadística y las interpretaciones informales e historias de las que han surgido. Creen que los números vienen de un reino distinto del de las historias, no los ven como síntesis, complementos o resúmenes de ellas. A menudo citan estadísticas a palo seco, sin el relato de apoyo ni el contexto necesario para darles sentido.[1]

Parte del contexto es interno y depende de la actitud. Como veremos más adelante, la gente no acaba de darse cuenta de que nuestra forma de caracterizar los individuos y los hechos, nuestra forma de enfocar sus circunstancias y su contexto, y nuestra forma de situarlos en coordenadas narrativas determina a menudo y en gran medida lo que pensamos de ellos. Por ejemplo, si para describir a una persona, Waldo, decimos que viene del país X, el 45 por ciento de cuyos ciudadanos tiene determinada característica, parece razonable suponer (si no sabemos nada más de él) que existe una probabilidad del 45 por ciento de que Waldo posea esa característica. Pero si para describir a Waldo decimos que pertenece a determinado grupo étnico, el 80 por ciento de cuyos miembros en el territorio abarcado por los países X, Y y Z tiene la característica en cuestión, seguramente asumiremos que existe una probabilidad del 80 por ciento de que Waldo posea la característica; y si lo describimos diciendo que pertenece a una organización de alcance nacional en la que sólo el 15 por ciento de sus miembros tiene la característica, es muy posible que pensemos que la probabilidad de que Waldo posea la característica es del 15 por ciento. Qué (combinación de) descripciones empleemos es, hasta cierto punto, cosa nuestra, de modo que las estadísticas satisfactoriamente exactas que citamos con toda confianza dicen tanto de nosotros como de Waldo (que, para que conste, no posee la característica).

Es más corriente que el problema no tenga que ver con nuestras actitudes, sino con nuestros conocimientos. La verdad es que desconocemos el contexto externo de casi todas las estadísticas que leemos u oímos comentar. Las preguntas contextuales que nos formulamos cuando leemos historias, por ejemplo, son las mismas que los estadísticos formulan cuando se les enseña una encuesta cualquiera. Queremos saber, como es natural, cuántos, con qué probabilidad y qué porcentaje. Pero también si las cifras sobre indigentes y niños maltratados, por ejemplo, proceden de los ficheros de la policía (en cuyo caso es probable que tiendan a la baja) o si proceden de estudios orientados científicamente (en cuyo caso es probable que sean un poco más altas) o si vienen de los comunicados de prensa de grupos con intereses creados (en cuyo caso es más que probable que sean muy altas, o muy bajas, según la ideología).[2]

Sin una ambientación, sin un trasfondo y sin indicaciones sobre su procedencia es imposible conocer la validez de las estadísticas. El sentido común y la lógica informal son tan esenciales para este cometido como la interpretación de las ideas estadísticas formales: son requisitos del saber numérico. Aunque muchas historias no necesitan números, ciertas descripciones, sin estadísticas de apoyo, corren el riesgo de desestimarse por anecdóticas. Por el contrario, aunque algunas cifras casi bastan por sí mismas, las estadísticas sin contexto corren el riesgo de ser estériles, irrelevantes, incluso carentes de sentido.

Veamos dos ejemplos recientes aparecidos en la prensa, el Índice de Precios al Consumo y el efecto del orden de nacimiento entre los hermanos. Comprender el tremendo efecto del IPC en la economía exige tener alguna idea no sólo de tasas y crecimiento exponencial, sino también de teoría económica, sistemas fiscales, política de partidos y psicología. Muchos economistas sugieren que el IPC, que sigue el precio de un paquete más o menos fijo de bienes de consumo, da una estimación demasiado elevada de la inflación y que el aumento de los costes de los planes gubernamentales y la disminución de las recaudaciones fiscales supondrán para el país, durante la década que viene, una pérdida de cientos de miles de millones de dólares. Lo sorprendente es que en esta argumentación hay más psicología que matemáticas y economía. Muchos creen que la estimación elevada procede del hecho de que el IPC no tiene en cuenta las mejoras en la calidad de los productos (televisores y coches, por ejemplo), la introducción de productos nuevos (el ordenador de bolsillo con el que escribo) ni la sustitución de un producto que estaba en el paquete por otro que no estaba (el pollo por la ternera, cuando sube el precio de ésta). La presunta exageración del IPC es una historia en la que las matemáticas desempeñan un papel importante, pero también una historia en la que la legislación fiscal, las prácticas sociales y la psicología personal aportan el contexto básico.

Algo parecido vemos en el efecto del orden de nacimiento, tema de un libro de Frank Sulloway, que sostiene que, a pesar de compartir el 50 por ciento de su ADN, los hermanos se diferencian sistemáticamente a causa del orden en que nacieron. Sulloway atribuye la diferencia a la dinámica familiar: los primogénitos abren un hueco en la familia y para proteger dicho hueco están más pendientes de los deseos de los padres, por lo que tienden a ser conservadores y defensores del sistema establecido. Los hijos que vienen después deben recurrir a métodos más creativos para competir con el mayor por el afecto de los padres y en consecuencia tienden a ser más innovadores. El tema es tan amplio como grueso el libro, y la estadística desempeña un papel clave en la argumentación de Sulloway, pero al igual que en el caso del IPC, la historia ambiental y sus supuestos son imprescindibles y susceptibles de análisis crítico (incluso cuando las matemáticas formales son indiferentes).

¿Por qué, por ejemplo, se considera a los niños nada más que primogénitos? También son los «pequeñines» de la familia. ¿Es el orden de nacimiento funcional (por adopción, muerte de otro hermano, abandono) un sustituto razonable del orden de nacimiento biológico? ¿Cómo sabemos si a un científico o a un político (esos que ha estudiado Sulloway) puede llamársele conservador o liberal? ¿Qué efectos puede producir que se limite el estudio a las figuras históricas con fama suficiente para que se haya escrito sobre ellas?

Sin necesidad de meternos en honduras, me gustaría subrayar que el olvido de la interdependencia de las historias y las estadísticas (y las enseñanzas que se derivan de este olvido) es una de las causas de que se menosprecien las estadísticas y, en términos generales, las matemáticas y la ciencia. Sus practicantes son tenidos a la vez por genios admirables y por chiflados que viven en una torre de marfil. (Casi nunca son ninguna de las dos cosas, los hay que son una y los hay que son la otra, pero raras veces las dos a la vez). Describir el mundo viene a ser como una competición olímpica entre los simplificadores (científicos en general, estadísticos en particular) y los complicadores (humanistas en general, contadores de historias en particular). Es una competición en la que deberían ganar los dos equipos.

Apunte para un cuento matemático

Las historias no sólo proporcionan un contexto a las afirmaciones estadísticas, sino que las animan e ilustran.[3]

Un amante de los libros, algo listillo, está contando a sus hijos la historia de Leo Rosten sobre el famoso rabino al que un estudiante, asombrado, le pregunta cómo se las arregla para ilustrar cualquier tema con una parábola perfecta. El rabino responde con una parábola sobre un reclutador del ejército del zar que pasa por una aldea y ve docenas de círculos de tiza en la pared de un granero, todos con un agujero de bala en el centro. El reclutador queda impresionado y pregunta a un vecino quién es aquel tirador tan estupendo. El vecino responde: «Ah, es Shepsel, el hijo del zapatero; un muchacho muy suyo». El entusiasta reclutador lo mira impasible hasta que el vecino añade: «Verá usted, primero dispara y luego traza los círculos alrededor de los agujeros».

El rabino sonríe y dice:

—Yo hago lo mismo. No busco parábolas que cuadren con los temas; me limito a tocar temas sobre los que ya tengo parábolas.

El hombre pone cara de preocupación mientras cierra el libro, dice a los niños que se vayan a dormir inmediatamente, da las buenas noches a su mujer con voz distraída y se retira a su estudio, donde se pone a hacer garabatos, llamadas telefónicas y cálculos. La idea de organizar un timo se va aclarando en su cabeza. Al día siguiente hace averiguaciones y va a correos, y luego pasa dos noches escribiendo cartas a millares de apostantes deportivos «pronosticando» el resultado de determinado encuentro. A la mitad le predice que ganará el equipo de casa, a la otra mitad que perderá. El truco está en que, pase lo que pase, habrá acertado para la mitad de los apostantes.

Su mujer se pregunta por el dineral gastado en sellos de correos y por las llamadas a escondidas, y comienza a incordiarle a propósito de su situación económica y conyugal, que va de mal en peor. La semana siguiente envía más cartas y hace otro pronóstico, pero esta vez sólo a la mitad de apostantes para la que ha acertado; de la otra mitad se olvida. A la mitad de este subgrupo le pronostica una victoria en otro evento deportivo y a la otra mitad una derrota. La historia se repite: para la mitad del subgrupo la predicción será correcta, lo que significa que para la cuarta parte del grupo original habrá acertado dos veces seguidas. Una semana después pronostica una victoria a la mitad de esta cuarta parte y una derrota a la otra mitad; y vuelve a olvidarse de los apostantes para los que se equivocó. Nuestro hombre ha acertado de nuevo, por tercera vez y sin fallar, por lo menos para la octava parte de los apostantes del comienzo. Continúa de este modo y prolonga la cadena de «pronósticos acertados» para grupos de apostantes cada vez menores. Entonces, con mucho tiempo por delante, envía a los que quedan una carta en que les señala su impresionante sucesión de aciertos y les pide una sustanciosa cantidad a cambio de seguir recibiendo aquellas útiles «profecías» que parecen milagrosas.

Muchos apostantes le envían el dinero y él hace otro pronóstico. Otra vez sale airoso ante la mitad de este último grupo y vuelve a olvidarse de la mitad para la que ha fallado. A los primeros les pide más dinero a cambio de otro pronóstico, se lo dan y la cosa continúa. Finalmente, cuando ya sólo quedan unos cuantos apostantes, uno, un hampón duro, localiza a nuestro hombre, lo secuestra y le exige un pronóstico con el que piensa hacer una apuesta muy elevada. El secuestrador amenaza a su familia e, incapaz de comprender cómo se las apaña aquel hombre para hacer tantos pronósticos sin fallar ni uno, se niega a creer que sea un timo. Nuestro hombre, para convencer al secuestrador de que no es adivino, hace algunas interesantes observaciones filosóficas. El torpe artista del timo y el musculoso secuestrador son un filón de contrastes digno de estudio: hablan idiomas diferentes, tienen marcos de referencia distintos, pero parecen adoptar actitudes parecidas ante las mujeres y el dinero. Presionado al máximo, el timador hace un pronóstico que por casualidad da en el blanco y el secuestrador, más convencido que nunca de que tiene en su poder la gallina de los huevos de oro, quiere arriesgar todo su capital y el de sus socios en la siguiente predicción.

En el desenlace aparece la amante del timador, que era la culpable de que éste necesitara el dinero negro del timo. La amante le ayuda a escapar de las garras del secuestrador para impedirle hacer un mal pronóstico que traería como consecuencia el asesinato de toda su familia. Gracias a un ingenioso código, entre los dos se las arreglan para pararle los pies al secuestrador y asustarle lo suficiente para que nunca más vuelva a molestarles. En la última escena vemos a nuestro hombre absorto en el timo del principio, pero esta vez con un índice bursátil, dado que ahora quiere una clientela más selecta. Se ha casado con la amante, pero tiene otra de reserva, que ya le pide dinero en cantidades crecientes. Está sentado ante su mesa y dibuja dianas en un sobre.

ΩΩΩ

La idea de ramificación de posibilidades que hemos visto en este boceto acude de manera natural a la cabeza del probabilista o del estadístico, ya que los llamados diagramas en árbol (introducidos por el físico y matemático holandés Christian Huygens a finales del siglo XVII) sirven para determinar la probabilidad de las series de sucesos. Pero los diagramas en árbol también son útiles cuando pensamos en las opciones que tienen los personajes de las historias o cuando meditamos giros de la trama con influencias más externas. Cada trayectoria que corre por las ramas del árbol de posibilidades (puede visualizarse el árbol creciendo con el tiempo hacia la derecha, en vez de hacia arriba) corresponde a una serie de opciones tomadas por los personajes u otros giros de la trama, mientras que las ramas secundarias y las ramitas corresponden a digresiones y desviaciones. Así, la ramificación hacia delante, la digresión lateral y el retroceso ocasional, a diversos niveles y escalas, pueden tomarse como modelo de nuestro modo general de contar historias.

Esta subdivisión de la realidad recuerda la idea, cada vez más popular, de una literatura generada por ordenador que no requeriría la progresión lineal de las historias. Más que leerla, nos pasearíamos por ella. A falta de un desarrollo argumental convencional, habría una cantidad indefinida de digresiones narrativas, no todas unificadas por la conciencia de un protagonista. Tras leer un episodio, podríamos avanzar linealmente, retroceder a un episodio anterior o movemos de lado fijándonos (pulsando la tecla del ratón) en cualquier palabra o expresión significativa, para que nos enviaran a su explicación. La virtud de esta arbórea proliferación de digresiones radicaría seguramente en la sensación de evanescencia, apertura y realismo que proporcionaría al navegante lector.

En un plano ideal leeríamos sólo los episodios, apartes y situaciones que nos parecieran intrigantes. Sería interesante que el «softexto» imaginado tuviera un misterio al final y que las soluciones dependieran de lo que el lector hubiese seleccionado. Ni siquiera en un texto de dimensiones mastodónticas podríamos desarrollar todas las ramificaciones imaginables. Hace falta arte para gobernar la explosión combinatoria de posibilidades, para tejer y coser sin costuras el material y crear así la ilusión de que hay decisiones libres y bifurcaciones naturales. En los nudos cruciales, por ejemplo, podrían limitarse las alternativas. El efecto, como el de una corriente de agua cuando pasa por un cuello de botella, sugeriría la determinación del protagonista en tales momentos.

Si se hacen las cosas bien (aunque los ejemplos que he visto están lejos de resultar satisfactorios), la casi sensible matriz de desviaciones, digresiones y movimientos horizontales que habría en una obra de estas características prestaría animación a los personajes e intensificaría la identificación con ellos. Los detalles, grandes y pequeños, en asuntos tanto críticos como triviales, nos apartarían de esta saga polidimensional y contribuirían a dar vida y color al ambiente y a la época. Los matemáticos especulan a menudo a propósito de lo que Arquímedes, Gauss, Poincaré y otros virtuosos de las matemáticas del pasado habrían conseguido con la capacidad de búsqueda y comprobación de los ordenadores, pero yo me pregunto por lo que Sterne, Joyce, Borges y otros cuya obra tiene reminiscencias de lo que apunto aquí habrían hecho con la ayuda de la informática. A pesar de su oceánica densidad, un texto así podría darnos el más vivido y exacto conocimiento de los individuos y sus circunstancias.

Como es lógico, una obra así podría desdeñarse como una simple curiosidad técnica. Un obstáculo más verosímil para su creación inmediata es la escasez de escritores capaces de perfilar matices literarios y sutilezas psicológicas y, a la vez, con la imaginación arquitectónica y las habilidades informáticas necesarias para articular una «historia» ramificada tan compleja.

Ámbitos narrativos y ámbitos estadísticos

Incontables historias, desde la Iliada y la Odisea hasta las películas de arte y ensayo y los teleculebrones, e incontables sondeos, encuestas y estudios ponen de manifiesto los muchos contrastes que hay entre las historias y las estadísticas. (La palabra incontable es útil incluso para un matemático, ya que describe un «número indeterminadamente grande». Las expresiones un sinfín y una infinidad también son de provecho). Una diferencia importante es que, en literatura, el foco de la atención se concentra casi siempre en los individuos y no en los análisis, las argumentaciones y las medias. Un enfoque así es necesario para corregir la abstracción desmesurada y mantener la estadística dentro de la perspectiva humana.

Aunque no se diga ninguna mentira, por poner un ejemplo extremo, hay algo inhumano y vagamente pornográfico en las estadísticas que sostienen que, como la mitad de la población estadounidense es masculina y la otra mitad femenina, el americano adulto medio tiene un ovario y un testículo. O que el ciudadano medio del condado de Dade, Florida, nace hispano y muere judío. No obstante, la pornografía, con sus series de cópulas (o tríos) sin historia encadenadas con total libertad, tiene con frecuencia el aspecto de un sondeo estadístico.

Pero el enfoque individualizador puede ser engañoso y manipulante, y distorsionar los análisis de temas de interés público, sobre todo los relacionados con la salud y la seguridad. Un dramático reportaje de televisión sobre una persona que reaccione de un modo anormal a una vacuna puede eclipsar los grandes beneficios que aporta esa misma vacuna. Son legión las trivializaciones fomentadas por los medios informativos.

Algunos periodistas intentan aprovechar las virtudes de las individualizaciones y los sondeos estadísticos mezclándolos indebidamente. El efecto no es tanto un puente como una caída en el abismo. Un ejemplo típico es la convención de evocar alguna persona «representativa» (un Jeremy, una Linda o un Kevin imaginarios, aunque nunca un Waldo o una Gertrude) para confirmar o ilustrar la conclusión estadística de un artículo periodístico. (Janet Cooke, del Washington Post, perdió un premio Pulitzer por llevar esta práctica al extremo).

Otros aspectos críticos del hiato que hay entre citar estadísticas y contar historias se derivan de que, como dicta la proverbial sabiduría del profesor de literatura, las historias no cuentan, muestran. Las historias pueden utilizar el diálogo y otros recursos, y no se limitan a las afirmaciones expositivas; en vez de exponer datos desnudos, desarrollan el contexto y las relaciones pertinentes; son abiertas y metafóricas, mientras que las estadísticas y las matemáticas por lo general son concluyentes y han de tomarse al pie de la letra; y las historias transcurren en el tiempo y no se presentan como intemporales.

Las historias presuponen un punto de vista concreto (o varios) y no ofrecen una panorámica impersonal sin sujeto agente, como hacen las estadísticas. Analicemos, por ejemplo, la idea de la distribución probabilística del peso de las mujeres de cierta población. Mediante una fórmula o una gráfica (por ejemplo, la conocida curva normal, de campana o de barriga, como muy bien la llama un alumno mío), nos permite contemplar desde las alturas la fracción de mujeres que entran en este o aquel intervalo de pesos. Por la distribución podemos ver el peso máximo, el mínimo, el más frecuente, el menos frecuente y muchas más cosas. Toda la información está allí, en una sola instantánea, aunque sin las dietas draconianas, los helados, las galletas, la comida basura, los atracones ni los ayunos de ninguna mujer en concreto.

Para bien o para mal, las historias individuales son más elementales que las estadísticas y, por ello, más evocadoras emotivamente. Expresiones como «traicionó a su mujer», «el pelo agitado por la brisa» y «apestaba a sobaco» no aparecen nunca en los estudios científicos. Por el contrario, vemos expresiones como «el 72,6% opinaba», «la correlación entre» y «márgenes de error». Incluso en un terreno tan saturado de estadísticas como el béisbol, la historia del romance de Babe Ruth hace que sus antiguas marcas de 60 carreras en una temporada y 714 en toda su trayectoria profesional tengan más grandeza que las nuevas marcas establecidas por Roger Maris y Henry Aaron respectivamente (y lo digo yo, que soy un veterano seguidor de los veteranos Braves de Milwaukee).

Hay, pese a todo, amalgamas de estadísticas e historias que hasta cierto punto salvan el abismo. En este confuso terreno intermedio tenemos historias al estilo de Rashomon, que recogen puntos de vista diferentes sobre la misma serie de fenómenos. Tenemos asimismo historias colectivas (como algunas teleseries) que engarzan historias de distintos miembros de un colectivo humano, y también historias al estilo de El puente de San Luis Rey, de Thorton Wilder, que relacionan libremente las aventuras de distintas personas desvinculadas entre sí. Sin embargo, cuantas más personas o perspectivas aparezcan, más planas y generales serán, y el avance del tiempo se reducirá gradualmente hasta llegar al muestreo representativo del momento presente de casi todas las encuestas y estudios estadísticos (aunque hay subdisciplinas de la estadística —procesos estocásticos y series temporales— cuyo objeto es la evolución de las cantidades variables en el tiempo).

Un símil informático podría sernos útil. Si comparamos las historias convencionales, contadas desde un solo punto de vista, con los procesadores en serie, que efectúan un solo cálculo a la vez, la estadística, que enfoca las cosas desde ninguna parte en concreto, sería entonces comparable a un grupo de procesadores en paralelo, que realizan cálculos simultáneos. Entre ambos hay amalgamas que podrían compararse a una cantidad variable de puntos de vista (procesadores) conectados de forma variable. Combinar las virtudes de estas dos formas tan dispares de entender el mundo (mediante historias y mediante estadísticas) puede considerarse un símil literario de un problema normal en diseño y arquitectura informáticos.

Demasiados rasgos, pocas personas

Sin embargo, el equilibrio justo entre profundidad de caracterización y cantidad de personajes no siempre está claro. En las historias, como en la vida cotidiana, nos relacionamos de manera personal con poca gente, pero se trata de gente real, tridimensional (a decir verdad, sería, desde un punto de vista matemático, gente de n dimensiones con valores altos de n). Estas personas poseen o están asociadas a una indeterminada cantidad elevada de rasgos, circunstancias, relaciones, reglas informales y pactos posibles. Ciertamente no lo sabemos todo de las más próximas a nosotros (ni siquiera de nosotros) y sin embargo estamos implícitamente tan al corriente de tantos detalles y de tanta riqueza contextual que ponerlo todo por escrito haría de nosotros unos malos novelistas. Incluso a las personas que conocemos mal les ponemos una docena de adjetivos y unos cuantos adverbios y les atribuimos un par de anécdotas. Compárese esta abundancia de pormenores personales con la mayoría de estudios científicos, donde puede haber muchísimas personas (u otros datos), pero se trata de personas planas, con sólo un par de dimensiones: por quién van a votar, si fuman o qué marca de refresco o de laxante prefieren.

Las historias y las estadísticas nos ofrecen posibilidades complementarias de saber mucho sobre unas cuantas personas o de saber poco sobre muchas. La primera nos conduce a la habitual observación de que las novelas ilustran grandes verdades sobre la condición humana. Las novelas son polisémicas y abundan en ironías, detalles y metáforas, mientras que las ciencias sociales y las estadísticas demográficas pueden parecemos, en comparación, obtusas y asquerosamente formales. No obstante, es fácil engañarse creyendo que las autobiografías, los libros de recuerdos, las novelas y los cuentos nos revelan más cosas de carácter general de lo que en realidad revelan. Los principales problemas, como es lógico, son siempre las muestras pequeñas y tendenciosas, pero mi advertencia surge de algo más concreto: la técnica y cacofónica idea estadística de coeficiente de correlación múltiple.

Si la cantidad de rasgos que consideramos es elevada en comparación con la cantidad de personas encuestadas, parecerá que hay entre los rasgos más relaciones de las que se obtienen en realidad. Imaginemos un estudio que ha analizado sólo dos personas y dos características, por ejemplo la inteligencia y la timidez. Imaginemos a continuación una gráfica con grados de inteligencia en un eje y grados de timidez en el otro, y dos puntos que corresponden a las dos personas. Si la más tímida de las dos fuera la más inteligente, habría una correlación perfecta entre los dos rasgos y una línea recta que uniera los dos puntos de la gráfica. A más timidez, más inteligencia. Pero si la más tímida de las dos fuera la menos inteligente, seguiría habiendo una correlación perfecta entre los dos rasgos y una línea recta uniendo los dos puntos en sentido contrario. A más timidez, menos inteligencia.

Se pueden encontrar, en grupos aleatorios de tres personas y tres características, y en general en grupos de n personas y n características, correlaciones perfectas que no significan nada. No es necesario que la cantidad de características sea igual a la de personas. Siempre que la cantidad de características sea una fracción significativa de la cantidad de personas, la llamada correlación múltiple sugerirá asociaciones falsas entre las características.

Para que nos diga algo útil, el análisis de correlación múltiple debe basarse en una cantidad de personas relativamente elevada y una cantidad de características mucho menor. Sin embargo, las intuiciones que suelen surgir de las historias y de la vida cotidiana son exactamente lo contrario. De cuerpo entero conocemos a pocas personas; en cambio, la cantidad de características, relaciones, características de relaciones, relaciones de características, etcétera, que conocemos a propósito de ellas es indeterminadamente elevada. Así, tendemos a sobreestimar nuestro conocimiento general de otros y creemos firmemente en un sinfín de asociaciones (variantes más complicadas de «a más timidez, menos inteligencia») que son pura fantasía. El descubrimiento de la verdadera significación de nuestros coeficientes de correlación múltiple hace que acabemos convenciéndonos de que sabemos un montón de cosas que no son verdad.

Así como las historias corrigen a veces la abstracción desmesurada de las estadísticas, las estadísticas corrigen en ocasiones la desorientadora riqueza de las historias.

Estereotipos, fantasías y conservadurismo estadístico

La alternativa cotidiana a los cálculos y explicaciones probabilísticos es la amorfa «disciplina» del sentido común y la opinión aproximada. En vez de aportar pruebas rigurosas o escrupulosas mediciones de proposiciones dadas, el sentido común piensa con argumentos narrativos y situaciones, proyectando e identificándose con personas, reaccionando a conversaciones y sopesando observaciones, y llegando por último a una opinión provisional y a veces caprichosa. El conocimiento resultante es cualitativo, impreciso e inseparable del contexto. El sentido común se arropa a menudo en el lenguaje de la probabilidad, pero ceñirse a una cantidad concreta, a una probabilidad específica, a un resultado posible es, con frecuencia (el 81,93 por ciento de las veces), un alarde de insensatez. A pesar del amplio espectro de la certeza injustificada, no se desaniman los que quieren dar a sus corazonadas un aire de respetabilidad científica.

En vez de invocar probabilidades exactas, en nuestro abordaje cotidiano de la vida nos parece más natural tratar con reglas generales y categorías aproximadas; en otras palabras, con estereotipos. Aunque muchos suponen que los estereotipos son siempre vestigios nefastos de la ignorancia, con mucha frecuencia son imprescindibles para la comunicación efectiva y han sido a su vez injustamente estereotipados (en el caso de que se pueda tratar injustamente un concepto). Muchos estereotipos permiten la necesaria economía expresiva para la comunicación rápida y el funcionamiento eficaz. La silla es un estereotipo, pero nunca hemos oído quejarse a los taburetes de los bares, a los asientos abatibles, a los pufs, a las obras de art déco, a las variedades de respaldo alto que amueblan los comedores, a las piezas de anticuario, a los divanes y otomanas, ni a los ejemplos de esta misma idea que hay en las cocinas. Como es lógico, los estereotipos admiten excepciones de todas clases que, analizadas de cerca en los casos individuales, son muy evidentes, pero esto no significa que deban, o puedan, proscribirse a título universal. La complejidad, la sutileza y la exactitud cuestan tiempo y dinero, que son gastos a menudo innecesarios y a veces incluso causa de confusión.

La identificación de estereotipos corrientes y el conocimiento de situaciones estereotípicas que se repiten, como el comportamiento en los restaurantes, ir de compras, las prácticas higiénicas, la actitud de la gente en un acto público, etcétera, son esenciales para orientarse en la vida de todos los días. Los estudios sobre inteligencia artificial, como los del científico informático Roger Schank y otros, han corroborado que trazamos nuestra andadura y nos comunicamos con los demás recordando tipos, argumentos y guiones comunes y corrientes de la manera que más nos conviene. Al igual que las ideas estadísticas, los estereotipos fuerzan los casos individuales y concretos, pero tienen la ventaja de resumir una información general, el registro de cuyas muchas excepciones consumiría demasiado tiempo.

No niego, como es lógico, que las personas esclavas de los estereotipos pueden fomentar prejuicios absurdos, crueles y que se confirman solos, y estoy decididamente contra eso.[4] Sin embargo, cuando nos encontramos con una persona, incluso cuando la vemos de lejos y de pasada, hay una tendencia a construir (vale, vale, yo tiendo a construir) una biografía inmediata de ella y a hacer, durante el proceso, multitud de juicios espontáneos. Y me cuesta no sacar conclusiones de largo alcance (a menudo equivocadas), por ejemplo, sobre las personas que utilizan la expresión «entre tú y yo».

Pero la especulación precedente no parece buena solución para el problema de los estereotipos. Si se me permite la libertad de informar de un presunto caso de presciencia que me ocurrió, recuerdo que hace varios años leí el comunicado de Unabomber, en la cima de una montaña de Maine, y que por su tono, su contenido y su estructura conjeturé que su autor era un matemático. Tiempo después, cuando lo detuvieron, escribí un artículo «de opinión» sobre el particular en el New York Times. Se pusieron tan furiosos algunos matemáticos que pensaban que aquello mancillaba su reputación que el Wall Street Journal dedicó un largo artículo al alboroto resultante. En mi artículo decía que el hecho de que Theodore Kaczynski, alias Unabomber,[5] fuese doctor en matemáticas probablemente no era tan incongruente como parecía (a pesar de que los matemáticos son casi siempre individuos graciosos, no solitarios insociables, y de que las únicas explosiones que manejan son las demográficas).

Incluso en casos así de raros cuesta reprimir los juicios precipitados y estereotipadores; es posible que incluso intentarlo sea desaconsejable. Sin embargo, si nos esforzamos por mantener los juicios en el plano de lo provisional y los apoyamos con datos hasta donde nos sea posible, el perjuicio no será grande. Por desgracia, tropiezo con frecuencia con personas que no hacen este esfuerzo. Afirman con convicción displicente que fulano es racista, o un admirador secreto, o que está nadando en oro, o que es homosexual, o cualquier otra cosa. Por lo general, estas afirmaciones se basan en un indescriptible cúmulo de rasgos que deben admitirse sin más ni más. A menos que la persona en cuestión sea muy conocida, raras veces se la interroga o investiga (dentro de la legalidad) para saber si realmente posee el rasgo que se le atribuye; a veces se averigua por otros medios que tal o cual corazonada era correcta y este acierto pasa a garantizar el de todas las corazonadas.

ΩΩΩ

Aunque los estereotipos pueden ser un puente entre las estadísticas y las historias, a veces, al igual que los puentes, son viejos, frágiles e inseguros. Las conclusiones estadísticas, a diferencia de los estereotipos, deben someterse a pruebas rigurosas. Este punto suele desestimarse por impertinente y quisquilloso; al fin y al cabo, «todo el mundo sabe» eso que se afirma. Tengo una versión personal de esta actitud: las personas que hablan mucho sobre lo que todo el mundo sabe son idiotas; todo el mundo lo sabe.

La toma de decisiones estadísticas es un proceso aburrido y conservador que no se parece a los juicios instantáneos y alegres que caracterizan la opinión personal. En estadística se llama hipótesis nula a la convicción de que el fenómeno, la relación o la hipótesis que se observa no es significativa, sino fruto de la casualidad. Para rechazar la hipótesis nula se requiere, por convención, que la probabilidad del fenómeno que se produce por casualidad sea inferior al 5 por ciento. (Éste es el origen de la anécdota sobre aquel estadístico que presenció la decapitación de veinticinco vacas, advirtió que una sobrevivía a la prueba y desestimó el fenómeno por no significativo). En mis peregrinaciones por este mundo he observado que son pocas las personas que toman regularmente decisiones así en sus asuntos personales; sería aburrido aun en el caso de que fuera posible tal precisión. (Tras haber hecho una defensa parcial de los estereotipos, quisiera añadir que un estereotipo que se aplica corrientemente a los estadísticos es que son personas que se han dedicado a esa profesión porque no soportan la emoción de contar).

La idea de aburrimiento me sugiere otra diferencia entre las historias y las estadísticas. Cuando escuchamos historias, tendemos a suspender la incredulidad para que nos entretengan, mientras que al evaluar las estadísticas tendemos a suspender la credulidad para que no nos den gato por liebre. En estadística se dice que cometemos un error de tipo I cuando rechazamos una verdad y un error de tipo II cuando aceptamos una falsedad. Como es lógico, no siempre hay forma de eludir los dos tipos de error y así tenemos diferentes umbrales de error según la acción que emprendamos. No obstante, el tipo de error que las personas cometen con más comodidad da algún indicio de su tipo de personalidad intelectual.

Las personas a quienes les gusta que las entretengan y les den gato por liebre, y que detestan la perspectiva de cometer un error de tipo I, es probable que prefieran las historias a las estadísticas. A las que no les gusta que las entretengan ni les den gato por liebre, y que detestan la perspectiva de cometer un error de tipo II, es más probable que prefieran las estadísticas a las historias. En cualquier caso, esta especulación es una breve anécdota sin estadísticas que la respalden, así que el lector puede pensar lo que quiera.

Aunque nos equivocamos muchas veces, confiamos más en nuestras decisiones instintivas que en las públicas. Todos (no sólo los republicanos de derechas) desconfiamos de las decisiones que se toman lejos de nosotros. Pedimos exactitud a los informes estadísticos en la toma de decisiones públicas, pero a menudo admitimos los razonamientos más absurdos de personas próximas a nosotros. En los grupos pequeños reina la confianza y se advierte poca necesidad de estadísticas. Como ha dicho Theodore Porter en Trust in numbers, los métodos y controles cuantitativos aparecen a menudo a causa de la debilidad política de las comunidades de expertos y de lo que sospecha ya la comunidad general sobre sus resultados. Los que desconfían de antemano es muy probable que apuntalen sus conclusiones con estadísticas pertinentes o por lo menos que las adornen con una falsa pátina estadística.

La impersonalidad pura de las estadísticas gusta a quienes aborrecen el desorden, la intimidad y el sentimiento (melodramático de las historias, situaciones y personas concretas. Parece en principio que las historias deberían atraer más a las mujeres estereotípicas y las estadísticas a los hombres estereotípicos (según el saber tradicional; no dispongo de estadísticas sobre si esto es verdadero de los hombres y mujeres reales). El conservadurismo y la impersonalidad de las prácticas estadísticas son una causa de su fiabilidad, mientras que la arbitrariedad y heterogeneidad de las historias personales son una causa de su atractivo.

ΩΩΩ

Puesto que la probabilidad y la estadística son formalizaciones de nuestras intuiciones preteóricas, suelen coincidir bastante con nuestros sentimientos personales. Sin embargo, estas disciplinas han desarrollado una vida propia, con independencia de nuestras actitudes y creencias, y las estadísticas nos dicen en muchas ocasiones que nuestros sentimientos personales nos han llevado por mal camino. Las personas reaccionan mejor en los grupos pequeños, donde pueden aplicar su sabiduría tradicional a los fines e intenciones de los demás y donde su psicología les permite entrever las acciones y conductas estereotípicas de los otros. También en este terreno resultan más seguras nuestras intuiciones narrativas, ya que unos cuantos detalles reveladores bastan con frecuencia para perfilar todo un mundo. Terminaré con un ejemplo tomado de una colección de historias brevísimas de Leonard Michaels, I would have saved them if I could. «La mano» es una irreducible joya psicológica de cincuenta y nueve palabras, que casi resulta matemática por su laconismo:

«Abofeteé a mi hijo pequeño. Mi cólera era terrible. Como la justicia. Entonces advertí que no sentía la mano. Le dije: “Mira, quiero explicarte las complejidades”. Le hablé con seriedad y cuidado, sobre todo de los padres. Cuando terminé me preguntó si quería que me perdonase. Le dije que sí. Me dijo que no. Como triunfos de la baraja».