El síndrome de discalculia[30]
Las estadísticas sobre la salud pueden ser nefastas para nuestra salud mental. Inmersos en ellas, tendemos a pasarlas por alto, a reaccionar ante ellas emocionalmente, a aceptarlas con los ojos cerrados, a no creémoslas o, sin ir más lejos, a malinterpretar su sentido. (El Instituto Nacional de Estadística Incuestionable dice que el 88,479% del país tiene una de estas cinco reacciones 5.613 veces al día, lo que da 8.373.429 casos de discalculia al año). Puesto que la recomendación de exponer y no decir no sabe de géneros literarios, pondré aquí ejemplos concretos que aclaren los errores psicológicos, matemáticos y factuales que hay detrás de muchas reacciones extemporáneas a las estadísticas y comentaré la manera que tienen los periódicos de propiciar estas mismas reacciones.
Primero, el componente psicológico de la discalculia. En los artículos sobre los teléfonos móviles, las cifras de las bajas militares y otros temas he descrito ya el impacto del «error de disponibilidad» en el sentido común matemático. La angustia, el temor y la fuerza de un episodio dramático pueden, por ejemplo, oscurecer la diferencia matemática entre el índice de incidencia de una afección y el número absoluto de casos. En un país del tamaño de Estados Unidos, una enfermedad que afecte, digamos, a una persona de cada millón afectará pese a todo a 260 personas. La propensión denominada «efecto ancla», que también se ha comentado más arriba, desempeña asimismo un papel en el conocimiento de los peligros para la salud, ya que la gente por lo general siente preferencia por el primer número que oye, sea cierto o no.
Los números redondos tienen también atractivo psicológico, en concreto los múltiplos de diez. Desde hace años, por ejemplo, se viene repitiendo que el 10% de los ciudadanos estadounidenses es homosexual, que sólo utilizamos el 10% de nuestra capacidad cerebral y que el índice de ineficacia de los preservativos es del 10%. Estas estadísticas son inventos, imagino, de nuestro sistema métrico decimal; en un sistema de base 12, tendríamos sin duda muchas estadísticas que hablasen del 8⅓%. Estos números, aunque pocos entiendan con exactitud lo que significan, una vez que se aceptan se vuelven reacios a las revisiones en profundidad.
Cuando los peligros para la salud barajan números elevados que están lejos de nuestro marco diario de referenciao más allá de nuestro gobierno personal, es más probable que nos afecten los factores psicológicos y que malinterpretemos los peligros reales. Las drogas, por ejemplo, son un azote social que nadie niega, pero las que más personas matan son el tabaco (400.000 al año) y el alcohol (90.000 al año), no la cocaína (8.000) o la heroína (6.000), que, sin embargo, producen más impacto emocional y más alarma. Como ha dicho el físico H. W. Lewis, las centrales nucleares despiertan el temor de la mayoría de los ciudadanos de Estados Unidos, pero el prosaico problema del plomo en la pintura vieja y las cañerías antiguas ha causado mucho más daño. Asimismo, el célebre bioquímico californiano Bruce Ames ha calculado que ingerimos 10.000 veces más pesticidas naturales que pesticidas fabricados por nosotros: el estragol de la albahaca, las hidrazinas de los hongos, las aflatoxinas de los cacahuetes, etc. Pero nadie va por ahí con una pegatina que diga ¿CACAHUETES? NO, GRACIAS. Lo que preocupa a la gente es que los campos electromagnéticos, que se han multiplicado por diez en los últimos cincuenta años, hayan provocado un aumento en los índices de leucemia, que la verdad es que ha aumentado muy poco en todo ese tiempo, en el caso de que haya aumentado algo.
Estas infundadas o por lo menos exageradas preocupaciones privadas no carecen de consecuencias públicas. Han desembocado, por ejemplo, en la promulgación de normativas tan ignorantes como la Cláusula Delaney de la Ley sobre Alimentación y Consumo de 1958, que exige que «ningún aditivo se considere seguro si se descubre que produce cáncer en personas o animales». Desde su promulgación, el radio de acción de la ley se ha ampliado hasta incluir pesticidas y otros contaminantes, pero sin especificar en ningún momento el nivel mínimo permitido. Y con el inevitable derroche de tiempo y energía para reducir a cero los riesgos de poca monta, han quedado muy poco dinero y ganas de afrontar peligros más contundentes aunque menos vistosos.
Luego vienen los detallitos estadísticos, más del lado matemático del continuo psicológico-matemático. Pensemos en la paradoja de Simpson, que no se refiere a la cobertura periodística del show de O. J., sino a una concreta equivocación matemática que se comete con frecuencia y que consiste en creer que si se saca la media de una serie de cantidades (o porcentajes) y a continuación se saca la media de estas medias, el número resultante será la media de todas las cantidades. Así, si un estudio señala que el 36% del grupo étnico A y el 45% del grupo étnico B mejoran a causa de un tratamiento, y si otro estudio dice que mejoran el 60% del grupo A y el 65% del grupo B, es tentador pero incorrecto afirmar que mejora un porcentaje más alto del grupo B. El primer estudio, por ejemplo, puede haber incluido a 100 miembros del grupo A y a 1.000 miembros del grupo B, mientras en el segundo estudio es posible que se invirtieran estas cantidades. De haber sucedido así, ¿cuántos de los 1.100 miembros de cada grupo étnico han mejorado?[31]
Pensemos ahora en la siguiente situación, distinta pero afín, que sugiere cómo puede llegar a publicarse un titular como LA MITAD DE LOS ENFERMOS LO ES A LARGO PLAZO. El señor X ha padecido desde hace años cierta enfermedad. En enero, A y X han recibido tratamiento por esta enfermedad. En febrero, A se cura, pero B contrae la dolencia. En marzo, B está mejor, pero C necesita tratamiento, etc. El pobre señor X la sufre todo el año. Si analizamos la incidencia en cualquier mes concreto, sin embargo, vemos que el 50% de los enfermos (siempre el señor X y otra persona) son pacientes crónicos. Sin embargo, sólo 1/13 por ciento de las personas que han tenido la enfermedad en un año dado la ha padecido durante un periodo largo.
Conocer la idea matemática de la «probabilidad condicional» es básico para interpretar bien las estadísticas. Como ya se dijo en otro artículo de este libro, la probabilidad de que una persona hable inglés por ser estadounidense es, supongamos, del 95%. La probabilidad condicional de que una persona sea estadounidense por hablar inglés es mucho menor, por ejemplo el 20%.
Para aplicar de manera convincente la probabilidad condicional, pensemos en este caso del teorema de Bayes: se nos ha hecho un análisis para saber si tenemos la temible enfermedad D (la discalculia quizá) y el médico nos ha dicho con toda solemnidad que el análisis ha dado positivo. ¿Hasta qué punto debemos deprimimos?
Para comprender que nos conviene experimentar un moderado optimismo, supongamos que los análisis de D son definitivos al 99% en el sentido que se indica a continuación. Si tenemos D, el análisis dará positivo 99 de cada cien veces y si no la tenemos, el análisis dará negativo 99 de cada cien veces. (Para simplificar las cosas me sirvo del mismo porcentaje para los dos resultados del análisis). Supongamos además que el 0,1% (una persona de cada mil) tiene ya esta rara enfermedad.
Ahora hay que suponer que se han hecho 100.000 análisis de D (ver el diagrama). ¿Cuántos darán resultado positivo? Por término medio, 100 de las 100.000 personas analizadas (el 0,1% de 100.000) tendrán D y por tanto, como el 99% de estos 100 dará positivo en los análisis, tendremos una media de 99 análisis positivos. De las 99.900 personas sanas, el 1% dará positivo, llegándose a un total de unos 999 análisis positivos (el 1% de 99.900 es 999). Así, del total de los 1098 análisis positivos (999 + 99 = 1.098), casi todos (999) son positivos falsos y, en consecuencia, la probabilidad condicional de que tengamos D por haber dado positivo en los análisis es de 99/1.098, un poco más del 9%; y esto tratándose de unos análisis que por lo visto eran seguros al 99%.
Por decirlo de otro modo, la probabilidad condicional de dar positivo por tener D es del 99%; sin embargo, sólo el 9% de los análisis positivos tendrá D.
La amplia gama de análisis, estimaciones y procedimientos que se hacen en estadística da lugar a muchos matices matemáticos que podrían tener consecuencias prácticas. Si se produce, por ejemplo, una infección colectiva de una enfermedad concreta, determinar cuándo hay algo serio y cuándo se trata sólo de una casualidad no es empresa fácil (en particular para las personas empeñadas en atribuir importancia a todo). Y todavía son pocas las personas que saben que lo decisivo en un muestreo aleatorio es su tamaño absoluto, no su porcentaje de población. Por antiintuitivo que parezca, un muestreo aleatorio de 500 personas hecho entre los 260 millones de habitantes de Estados Unidos predice en términos generales muchísimas más cosas sobre su población (tiene un margen de error más pequeño) que un muestreo aleatorio de 50 sobre una población de 2.600.
La probabilidad condicional de tener D por haber dado positivo es de 99/1.098, un poco más del 9%.
Una confusión más elemental y muy extendida es la que se da entre correlación y causa. Ciertos estudios han demostrado repetidas veces, por ejemplo, que los niños de brazos más largos razonan mejor que los de brazos más cortos, pero aquí no hay ninguna idea de causa. Los niños de brazos más largos razonan mejor porque tienen más edad. Pensemos en un titular que nos invite a inferir una conexión causal: SE RELACIONA EL AGUA MINERAL CON LA SALUD INFANTIL. Habría que declinar la invitación si no se nos dan más pruebas, puesto que es muy probable que las familias pudientes beban agua mineral y tengan hijos sanos; tienen la estabilidad y los medios para disponer de comida, ropa, cobijo y educación, todo de calidad. Las familias que poseen aparatos de preparar cappucini es más probable que tengan hijos sanos por el mismo motivo. Cuestionar por sistema las correlaciones cuando se quiere relacionar tal práctica con cual situación o condición es un buen ejercicio de higiene estadística.
En otros casos, el misterio de las estadísticas no es fruto de anteojeras psicológicas ni de esoterismo matemático, sino de la ausencia de información sobre qué significan y cómo se han obtenido. El citado 10% de ineficacia en los preservativos, tomado de un estudio de planificación familiar, es un ejemplo. Parece que se obtuvo preguntando a las parejas cuál era el principal método de control de natalidad que utilizaban y si les había fallado alguna vez. Aproximadamente una de cada diez parejas que utilizaban preservativos respondió que sí y así se elaboró la estadística, aunque por lo visto no ha habido más encuestas que corroboren ese porcentaje.
Si el problema es la impermeabilidad del preservativo, el porcentaje mencionado es bajísimo. (Basándose en investigaciones propias y ajenas, Consumer Reports llegó a la siguiente conclusión: «En principio, los preservativos de látex podrían estar cerca del 100% de eficacia»). Si lo que preocupa es la anticoncepción, los datos dependen en buena medida de la edad, la raza y el estado civil, categorías que nada tienen que ver, sin duda, con el índice de ineficacia de los preservativos. Del mismo modo, si el tema en cuestión es la prevención de las enfermedades venéreas, las cifras dependen una vez más del celo con que se utilizan los preservativos, aunque es difícil calcular estas cifras, salvo, tal vez, en el caso de los voyeurs. Pese a todo, hay muchos datos circunstanciales: las prostitutas de Nevada cuyos clientes siempre utilizan preservativo, por ejemplo, no contraen casi ninguna enfermedad venérea.
No contextualizar las estadísticas impide, incluso en el caso de las más exactas, valorar claramente el riesgo personal. Por ejemplo, suele afirmarse que una de cada ocho mujeres padecerá cáncer de mama. La cifra es exacta, pero también equívoca, y por varios motivos. Primero, se trata del riesgo de incidencia, no del riesgo de mortalidad, que es 1 de cada 28. Segundo, el índice de incidencia del cáncer de mama, como el de casi todos los cánceres, crece con la edad; el riesgo de que a una mujer de cincuenta años se le declare cáncer de mama es de 1 entre 50, pero entre las mujeres de ochenta y cinco años el riesgo es de 1 entre 9. Según un informe del Instituto Nacional para el Cáncer publicado en 1993, la ciudadana media de cuarenta años tiene un 1,58% de posibilidades de desarrollar la enfermedad antes de llegar a los cincuenta y el 3,91% de posibilidades de desarrollarla antes de los sesenta. La ciudadana media de veinte años, por el contrario, tiene un 0,04% de posibilidades de desarrollar la enfermedad antes de cumplir treinta años y un 0,47% de posibilidades de desarrollarla antes de los cuarenta.
El riesgo global de tener cáncer de mama se ha elevado en los últimos veinte años, aunque es necesario recordar dos factores. El aumento de las revisiones preventivas ha dado lugar al descubrimiento temprano de más cánceres, y las mujeres mueren menos por otras causas y llegan a edades en que el riesgo de incidencia es mayor. Interesa señalar que cualquier práctica sanitaria que se correlacione en sentido ascendente con la longevidad, probablemente se correlacionará también en sentido ascendente con la incidencia del cáncer.
Este hecho trae a las mientes la estadística, verdadera pero potencialmente engañosa, de que las enfermedades cardíacas y el cáncer son las dos principales causas de defunción de los ciudadanos estadounidenses. De los aproximadamente dos millones de estadounidenses que mueren cada año, por ejemplo, casi la mitad muere de enfermedades cardiovasculares y alrededor de la cuarta parte de dolencias de diversa índole. Sin embargo, según los Centros de Control de la Enfermedad, las muertes accidentales —caídas, accidentes de tráfico, asfixias, envenenamientos, incendios, armas que se disparan, etc.— suman un total algo superior de años de vida potencial perdidos (y que se restan de la edad convencional de sesenta y cinco años). La edad media de las víctimas de accidentes está muy por debajo de la edad media de las víctimas del cáncer y las enfermedades cardíacas. El sida y el homicidio también descuellan de modo siniestro en esta misma dimensión. En todos estos casos es menor la cantidad de defunciones, pero la cantidad de años de vida perdidos es mayor.
Una nota final: las estadísticas de exactitud increíble, como las que he mencionado en son de broma al principio de este artículo, suelen ser falsas. Pensemos en un número exacto que conocen muy bien los padres y médicos de Estados Unidos: que la temperatura normal del cuerpo humano es de 98,6° Farenheit. Investigaciones recientes en que se han hecho millones de comprobaciones han puesto de manifiesto que la cifra es falsa. La culpa, sin embargo, no la tienen las comprobaciones históricas del Dr. Wunderlich, cuyos resultados se redondearon para que coincidieran con el grado más próximo, el 37 de la escala centígrada. Al traducirse esta medida a la escala Farenheit, sin embargo, la operación redondeadora se olvidó y se obtuvo un resultado —98,6— que especificaba incluso las décimas. Si se hubiera tenido en cuenta que el resultado de las mediciones históricas fue una oscilación entre 36,5° y 37,5° centígrados, la temperatura expresada en grados Farenheit habría oscilado entre 97,7° y 99,5°. Por lo visto, la discalculia da fiebre a veces.