Leyes de los gases perfectos en sociología
Al ver las estadísticas diarias que se publican en el USA Today, me pregunto hasta qué punto se han convertido en pasatiempo nacional las computaciones y los sondeos de opinión. Esta forma de enfocar las cosas que hoy nos parece moneda corriente se remonta al siglo pasado, al académico belga Adolphe Quetelet, que escribió:
«Así pasan los años y siempre con la tristeza de ver los mismos delitos reproducidos en el mismo orden y de aplicar los mismos castigos en las mismas proporciones. ¡Triste condición de la humanidad! Se diría que la parte de cárceles, grilletes y patíbulos que le toca se ha fijado con la misma exactitud que los tributos. Podríamos enumerar por adelantado cuántos individuos se mancharán las manos con la sangre de sus semejantes, cuántos serán falsificadores y cuántos irán a prisión casi del mismo modo que podemos contar por adelantado los nacimientos y defunciones que ha de haber».
La perspectiva impersonal que las estadísticas y las encuestas producen sirve para neutralizar la fascinación que sentimos ante los individuos, los extremos y las anomalías. Aunque los detalles de un acontecimiento son con frecuencia importantísimos, la incapacidad para detenerse a confrontar opiniones y observaciones conduce a una miope preferencia por las minucias, como ya he subrayado más arriba. Una de las más básicas herramientas matemáticas que justifican este detenerse a confrontar es el llamado teorema central del límite, que afirma que la media (o suma) de una amplia serie de mediciones traza una curva normal en forma de campana aunque no lo hagan las mediciones particulares.
Imaginemos, por ejemplo, una empresa que fabrica comida de régimen. Supongamos que la dirige un sádico experto en nutrición que comunica que sólo el 60% de los sobres contiene las 500 calorías anunciadas, que el 30% de los sobres contiene alrededor de 2.000 calorías y que el 10% contiene alrededor de 5.000 calorías. La distribución del contenido calórico de estos sobres no se puede describir mediante una curva normal de campana, pero sí mediante una curva de tres crestas, una en las 500 calorías y otras dos más pequeñas en las 2.000 y las 5.000 calorías.
Supongamos ahora que los sobres salen de la cadena de montaje en orden aleatorio y que se envasan en cajas de treinta y seis sobres. Si un ingeniero de control de calidad quisiera conocer el contenido calórico medio de todos los sobres de una caja, vería que es de unas 1.400 calorías, por ejemplo 1.419. Si quisiera averiguar el contenido calórico medio de los sobres de otra caja de treinta y seis, comprobaría que es igualmente de unas 1.400 calorías, tal vez 1.386. La verdad es que si comprueba más cajas, verá siempre que la media del contenido calórico está alrededor de 1.400. Más sorprendente es saber que la distribución de estos resultados medios será más o menos normal, en forma de campana, con el debido porcentaje de cajas con una media entre 1.350 y 1.450, entre 1.300 y 1.500, etc.
El teorema central del límite afirma que, en una amplísima gama de circunstancias, las medias (o sumas) incluso de cantidades distribuidas sin normalidad tendrán sin embargo una distribución normal. Entre las cantidades que tienden a la distribución normal podemos mencionar la estatura y el peso en edades concretas, el consumo de agua de una ciudad en un día concreto, la cantidad de pasas que hay en las cajas de cereales, la anchura de las piezas de una máquina, los coeficientes de inteligencia (sea cual fuere su finalidad o su falta de finalidad y midan lo que midieren), los ingresos en un hospital grande durante un día cualquiera, las distancias entre los dardos y el centro de la diana, el tamaño de las hojas y la cantidad de refrescos expendida por una máquina pública. Todas estas cantidades pueden considerarse la media de muchos factores (físicos, genéticos, sociales) y por eso se distribuyen con normalidad.
Hay otras formas de encontrar un orden medio en el desorden. Por ejemplo, en el campo de la física que se conoce con el nombre de mecánica estadística, los científicos no buscan la trayectoria de las moléculas particulares de un gas dentro de un recipiente, sino que prefieren analizar diversas medias estadísticas de las moléculas. También aquí son muy estables las medias y explican ciertas propiedades macroscópicas, como la temperatura del recipiente. Del mismo modo, en vez de decir dónde está situado cada objeto de la habitación de mi hijo, puedo optar por decir que la habitación está hecha un desastre. La descripción en cuanto tal proporciona información útil. Por ejemplo, no hay ni un solo rincón despejado, ni un solo libro en su sitio, y que nadie se escandalice si ve restos de comida por todas partes. Los fondos de inversión constituyen otro ejemplo: resultan atractivos porque, debidamente calculados, fluctúan mucho menos que los valores particulares que contienen y de aquí que sean más susceptibles de previsión que los valores particulares.
Dada una colección cualquiera de objetos y de relaciones entre ellos, siempre se le encontrará un orden o pauta, aunque sólo sea la constatación de la aleatoriedad de los objetos. La aleatoriedad a un nivel del análisis es como un orden a un nivel superior. Los movimientos aleatorios de las moléculas particulares dan lugar, a nivel macroscópico, a las leyes de los gases perfectos. La disposición caprichosa de los enseres da lugar a las leyes del desastre adolescente. Los fondos debidamente seleccionados dan lugar a la teoría de la cartera.
Como ya observaba Quetelet, una misma idea, concebible como una especie de sociomecánica estadística, es aplicable a la sociología, los deportes, la sexualidad,[41] la ciencia política y la economía. Visto de este modo, no deja de tener vigencia el viejo chiste del sondeo de opinión con una lavativa en la mano. Hay, como es lógico, muchísimas parcialidades, innumerables malinterpretaciones posibles y muchos estudios deprimentemente tendenciosos, pero si se hace bien, el proceso funciona; produce conocimiento.