11
Volviendo a tejer el mundo


Desde que empezó mi educación siempre se me han descrito las cosas con sus colores y sonidos, por alguien con agudos sentidos y una fina percepción de lo que es significativo. Por lo tanto, generalmente pienso en las cosas como coloreadas y resonantes. El hábito explica una parte. El alma explica otra. El cerebro, con su construcción a base de cinco sentidos, hace valer su derecho y explica el resto. Incluyéndolo todo, la unidad del mundo pide que el color se mantenga en él, tenga yo conocimiento de él o no. En lugar de cerrarme la puerta, tomo parte en ello discutiéndolo, feliz en la felicidad de los que están cerca de mi y que ven los magníficos tonos de la puesta de sol o del arco iris.

Helen Keller, The Story of My Life [La historia de mi vida] (1902)

Mientras que el acervo genético de una especie es esculpido en un conjunto de modelos de mundos ancestrales, el cerebro de un individuo alberga un conjunto paralelo de modelos del propio mundo del animal. Ambos son equivalentes a descripciones del pasado, y ambos son usados para contribuir a la supervivencia en el futuro. La diferencia es de escala de tiempo y de intimidad relativa. La descripción genética es una memoria colectiva que pertenece a la especie en su conjunto, y que se remonta al pasado indefinido. La memoria del cerebro es privada y contiene las experiencias del individuo desde que nació.

Nuestro conocimiento subjetivo de un lugar familiar lo sentimos realmente como un modelo del lugar. No un modelo a escala preciso, ciertamente menos preciso de lo que pensamos que es, pero un modelo útil para los fines requeridos. Hace algunos años el fisiólogo de Cambridge Horace Barlow (quien, dicho sea de paso, es descendiente directo de Charles Darwin) propuso una manera de abordar esta idea. Barlow está especialmente interesado en la visión, y su razonamiento parte de la constatación de que el reconocimiento de un objeto es un problema mucho más difícil de lo que nosotros, que vemos aparentemente sin esfuerzo, concebimos de ordinario.

Porque somos dichosamente inconscientes de la formidable e ingeniosa tarea que realizamos cada segundo de nuestra vida de vigilia al ver y reconocer objetos. La tarea de los órganos de los sentidos de destejer los estímulos físicos que los bombardean es fácil comparada con la tarea del cerebro de volver a tejer un modelo interno del mundo del que después pueda hacer uso. El argumento es válido para todos nuestros sistemas sensoriales, pero me referiré en mayor medida a la visión porque es el que mayor significado tiene para nosotros.

Piénsese en el problema que resuelve nuestro cerebro cuando reconoce algo, por ejemplo una letra A; o en el problema de reconocer la cara de una persona determinada. Por una convención gremial, desde hace tiempo se asume que la cara hipotética de la que estamos hablando pertenece a la abuela del distinguido neurobiólogo J. Lettvin, pero sustitúyala el lector por cualquier cara que conozca, o por cualquier objeto que pueda reconocer. Aquí no nos referimos a la conciencia subjetiva, con el problema, duro desde el punto de vista filosófico, de lo que significa ser consciente de la cara de la abuela de uno. Para empezar, basta con pensar en una célula cerebral que se dispara si, y sólo si, la cara de la abuela aparece en la retina, y esto sólo ya es muy difícil de abordar. Sería fácil si pudiéramos suponer que la cara siempre se proyecta en un lugar determinado de la retina. Podría haber allí una disposición en bocallave, con una región de células retinianas, con la forma de la abuela, conectada a la célula cerebral que emite señales cuando aparece su imagen. Otras células (miembros de la «antibocallave») tendrían que ser inhibidoras, pues de no ser así el sistema nervioso central respondería a una hoja blanca con la misma fuerza que a la cara de la abuela que, junto con todas las demás imágenes concebibles, necesariamente «contendría». La esencia de responder a una imagen clave reside en evitar responder a cualquier otra.

Debe descartarse la estrategia de la bocallave por la misma fuerza de los números. Incluso si Lettvin necesitara reconocer sólo a su abuela, ¿cómo se las arreglaría cuando su imagen cae en una parte diferente de la retina? ¿Cómo arreglárselas con el tamaño y forma cambiantes de su imagen cuando la abuela se acerca o retrocede, cuando gira lateralmente o se inclina hacia atrás, cuando sonríe o frunce el entrecejo? Si sumamos todas las combinaciones posibles de bocallaves y antibocallaves, el número alcanza la escala astronómica. Cuando nos damos cuenta de que Lettvin puede reconocer no sólo la cara de su abuela, sino cientos de otras caras, los otros fragmentos de su abuela y de otras personas, todas las letras del alfabeto, todos los miles de objetos a los que una persona normal puede dar nombre al instante, en todas las orientaciones y tamaños aparentes posibles, la explosión de células que se disparan se nos va rápidamente de las manos. El psicólogo americano Fred Attneave, que había llegado a la misma idea general que Barlow, ilustró el asunto con el siguiente cálculo: si sólo hubiera una célula cerebral para tratar, a la manera de la bocallave, cada imagen que podamos distinguir en todas sus presentaciones, el volumen del cerebro tendría que medirse en años luz cúbicos.

Así, pues, con una capacidad cerebral que se mide sólo en cientos de centímetros cúbicos, ¿cómo lo hacemos? La respuesta la propusieron Barlow y Attneave, cada uno por su lado, en los años cincuenta. Ambos sugirieron que los sistemas nerviosos explotan la enorme redundancia que contiene toda información sensorial. Redundancia es un término de la jerga de la teoría de la información, que originalmente desarrollaron los ingenieros, preocupados por la economía de la capacidad de las líneas telefónicas. Información, en el sentido técnico, es el valor de la sorpresa, medida como el inverso de la probabilidad esperada. La redundancia es lo opuesto de la información, una medida de la falta de sorpresa, de lo anticuado. Los mensajes o partes de mensajes redundantes no son informativos porque el receptor, en cierto sentido, ya sabe lo que está llegando. Los periódicos no portan titulares que digan «El Sol salió esta mañana». Esto transmitiría una información prácticamente igual a cero. Pero si llegara una mañana en la que el Sol no saliera, los que escriben titulares, suponiendo que sobreviviera alguno, sacarían mucho partido de ello. El contenido de información sería elevado, medido como el valor de sorpresa del mensaje. Gran parte del lenguaje hablado y escrito es redundante; por ello es posible el lenguaje condensado utilizado en el telégrafo: se pierde la redundancia, se conserva la información.

Todo lo que sabemos sobre el mundo que hay fuera de nuestro cráneo nos llega a través de las neuronas, cuyos impulsos traquetean como ametralladoras. Lo que pasa a través de una neurona es una ráfaga de «picos», impulsos cuyo voltaje es fijo (o, en todo caso, irrelevante), pero cuyo ritmo de llegada varía significativamente. Pensemos ahora en los principios de la codificación. ¿Cómo traduciríamos la información procedente del mundo exterior, como el sonido de un oboe o la temperatura del agua de una bañera, en un código de pulsos? A primera vista, es un código sencillo: cuanto más caliente esté el agua del baño, más rápidamente debe disparar la ametralladora. En otras palabras, el cerebro tendría un termómetro calibrado en tasas de impulsos. En realidad, éste no es un buen código, porque es antieconómico. Al explotar la redundancia, es posible diseñar códigos que transmiten la misma información a un coste menor de impulsos. Las temperaturas en el mundo permanecen en gran medida constantes durante largos periodos de tiempo. Señalar «Está caliente, está caliente, todavía está caliente…» continuamente mediante un ritmo elevado de pulsos de ametralladora es antieconómico; es mejor decir «Se acaba de calentar» (ahora se puede asumir que permanecerá así hasta nuevo aviso).

Para satisfacción nuestra, esto es lo que hacen principalmente las células nerviosas, no sólo para indicar la temperatura, sino para señalarlo casi todo acerca del mundo. La mayoría de neuronas están sesgadas para señalar cambios en el mundo. Si una trompeta toca una larga nota sostenida, una neurona típica que informara al cerebro de ello mostraría la siguiente pauta de impulsos: antes de que la trompeta empiece a sonar, una tasa de disparos baja; inmediatamente después, una tasa de disparos alta; mientras la trompeta siga sosteniendo la nota, la tasa de disparos se amortigua hasta un bisbiseo infrecuente; en el momento en que la trompeta se detiene, la tasa de disparos se eleva, y se amortigua de nuevo hasta un murmullo de reposo. También podría haber una clase de neuronas que se disparen sólo en el inicio de los sonidos y una clase distinta que sólo se active cuando los sonidos desaparecen. Una explotación similar de la redundancia (que explora la regularidad del mundo) funciona en las células que informan al cerebro acerca de los cambios de luz, temperatura o presión. Todo lo que hay en el mundo es señalado como cambio, y ésta es una economía importante.

Pero ni al lector ni a mí nos parece que el sonido de la trompeta se amortigua. Para nosotros la trompeta parece seguir sonando al mismo volumen y después detenerse abruptamente. Claro que sí. Esto es lo que cabe esperar de un sistema de codificación ingenioso que no descarta la información, sino que sólo se deshace de la redundancia. Al cerebro sólo se le notifican los cambios, y entonces está en posición de reconstruir el resto. Barlow no lo dice así, pero podríamos decir que el cerebro construye un sonido virtual, utilizando los mensajes procedentes de los nervios provenientes de los oídos. El sonido virtual reconstruido es completo y no abreviado, aun cuando los mismos mensajes son económicamente desguarnecidos hasta que sólo queda la información sobre los cambios. El sistema funciona porque el estado del mundo en un momento determinado no suele ser demasiado distinto del que había en el segundo anterior. Sólo si el entorno cambiara de forma caprichosa, aleatoria y frecuente, sería económico para los órganos de los sentidos señalar continuamente el estado del mundo. Pero resulta que los órganos de los sentidos están preparados para señalar, de manera económica, las discontinuidades del mundo; y el cerebro, que supone correctamente que el mundo no cambia de forma caprichosa y aleatoria, utiliza la información para construir una realidad virtual interna en la que se restaura la continuidad.

El mundo presenta un tipo equivalente de redundancia en el espacio, y el sistema nervioso utiliza el truco correspondiente. Los órganos de los sentidos informan al cerebro acerca de los bordes, y el cerebro rellena los aburridos vacíos entre ellos. Suponga el lector que está mirando un rectángulo negro sobre fondo blanco. La escena entera se proyecta en su retina (puede pensarse en la retina como una pantalla cubierta por un denso tapiz de minúsculas fotocélulas, los bastones y los conos). En teoría, cada fotocélula podría transmitir al cerebro el estado exacto de la luz que cae sobre ella. Pero la escena que estamos mirando es enormemente redundante. Las células que registran el negro tienen una probabilidad abrumadora de estar rodeadas por otras células que registran negro. Casi todas las células que registran el blanco están rodeadas por otras células que señalan blanco. Las excepciones importantes son las células de los bordes. Las que se hallan en el lado blanco del borde señalan blanco, como hacen sus vecinas que se encuentran situadas más hacia dentro del área blanca. Pero sus vecinas del otro lado están en el área negra. El cerebro puede reconstruir teóricamente toda la escena si sólo disparan las células retinianas de los bordes. Si esto se pudiera conseguir habría un enorme ahorro de impulsos nerviosos. De nuevo, se elimina la redundancia y sólo entra la información.

En la práctica, la economía se consigue mediante el elegante mecanismo conocido como «inhibición lateral». He aquí una versión simplificada del principio, utilizando nuestra analogía de la pantalla de fotocélulas. Cada célula fotoeléctrica envía un cable largo al ordenador central (cerebro) y también cables cortos a sus vecinas inmediatas en la pantalla de fotocélulas. Las conexiones cortas inhiben las células vecinas, es decir, reducen su tasa de descarga. Es fácil ver que las mayores frecuencias de descarga procederán sólo de las células que se encuentran a lo largo de los bordes, porque sólo serán inhibidas por un lado. La inhibición lateral de este tipo es común entre las unidades de bajo nivel de los ojos de vertebrados e invertebrados.

Una vez más, podríamos decir que el cerebro construye un mundo virtual que es más completo que la imagen que le transmiten los sentidos. La información que los sentidos suministran al cerebro es principalmente información sobre bordes. Pero el modelo cerebral es capaz de reconstruir las piezas entre los bordes. Como en el caso de las discontinuidades en el tiempo, se consigue economizar por la eliminación (y la posterior reconstrucción en el cerebro) de la redundancia. Esta economía sólo es posible porque en el mundo existen manchas uniformes. Si los tonos y colores del mundo estuvieran salpicados al azar por todas partes, no sería posible una remodelación económica.

Otro tipo de redundancia surge del hecho de que en el mundo real muchas líneas son rectas, o bien suavemente curvadas y, por lo tanto, predecibles (o matemáticamente reconstruibles). Si se especifican los extremos de una línea, la parte intermedia puede rellenarse utilizando una regla sencilla que el cerebro ya «conoce». Entre las neuronas que se han descubierto en el cerebro de los mamíferos están las llamadas «detectoras de líneas», neuronas que disparan siempre que una línea recta, orientada en cierta dirección, se proyecta sobre un lugar determinado de la retina, el llamado «campo retiniano» de la neurona. Cada una de estas células detectoras de líneas tiene sus propias direcciones preferentes. En el cerebro del gato sólo existen dos direcciones preferentes, horizontales y verticales, con un número aproximadamente igual de neuronas para cada dirección; en los monos se acomodan otros ángulos. Desde el punto de vista del argumento de la redundancia, lo que sucede aquí es lo que sigue. En la retina, todas las células situadas a lo largo de una línea recta descargan y la mayoría de estos impulsos son redundantes. El sistema nervioso economiza utilizando una única célula para registrar la línea, etiquetada con su ángulo. Las líneas rectas están especificadas de manera económica únicamente por su posición y dirección, o por sus extremos, no por el valor luminoso de cada punto a lo largo de su longitud. El cerebro rehace una línea virtual en la que se reconstruyen los puntos a lo largo de la línea.

Sin embargo, si una parte de una escena se separa de pronto del resto y empieza a arrastrarse sobre el fondo, esto es una noticia y hay que señalarlo. Los biólogos han descubierto efectivamente neuronas que están silenciosas hasta que algo se mueve contra un fondo inmóvil. Estas células no responden cuando se mueve toda la escena: ello correspondería al tipo de movimiento aparente que el animal vería si él mismo se moviera. Pero el movimiento de un pequeño objeto contra un fondo inmóvil es rico en información, y existen neuronas sintonizadas para detectarlo. De ellas, las más famosas son las llamadas «detectoras de bichos», descubiertas en las ranas por Lettvin (el de la abuela) y sus colegas. Un detector de bichos es una célula que aparentemente es ciega a todo excepto al movimiento de pequeños objetos sobre un fondo fijo. Tan pronto como un insecto se desplaza en el campo cubierto por un detector de bichos, la célula empieza a emitir señales de manera inmediata y masiva, y es probable que la lengua de la rana salga disparada para capturar al insecto. Sin embargo, para un sistema nervioso lo bastante refinado incluso el movimiento de un bicho es redundante si es rectilíneo. Una vez uno ha sido informado de que un bicho está moviéndose uniformemente en dirección norte, uno puede asumir que continuará moviéndose en dicha dirección hasta nuevo aviso. Llevando la lógica un paso más allá, debemos esperar encontrar en el cerebro células detectoras de movimiento de orden superior que sean especialmente sensibles al cambio del movimiento, pongamos cambio en dirección o en velocidad. Lettvin y sus colegas hallaron una célula que parece hacer esto, de nuevo en la rana. En su artículo publicado en Sensory Communication (1961) describen un experimento concreto como sigue:

Empecemos con un hemisferio gris vacío para el campo visual. Generalmente no hay respuesta de la célula al encendido y apagado de la iluminación. Está silenciosa. Introducimos un pequeño objeto oscuro, digamos de 1 a 2 grados de diámetro, y en un determinado punto de su desplazamiento, casi en cualquier lugar del campo, la célula «advierte» de pronto su presencia. A partir de entonces, siempre que este objeto se mueve, la neurona sigue su recorrido. Cada vez que se mueve, incluso con la menor de las sacudidas, hay un estallido de impulsos que se amortigua hasta un murmullo que continúa mientras el objeto sea visible. Si se mantiene el movimiento del objeto, los estallidos señalan discontinuidades en el movimiento, como el girar esquinas, la inversión del movimiento, etcétera, y tales estallidos tienen lugar sobre un murmullo contínuo de fondo que nos dice que el objeto es visible para la célula…

Resumiendo, es como si el sistema nervioso estuviera sintonizado a sucesivos niveles jerárquicos para responder fuertemente a lo inesperado y débilmente o nada a lo esperado. Lo que sucede a niveles sucesivamente superiores es que la definición de lo que es esperado se hace cada vez más refinada. Al nivel más bajo, cada mancha de luz es noticia. En el nivel siguiente, sólo los bordes son «noticia». A un nivel todavía superior, puesto que muchos bordes son rectos, sólo los extremos de los bordes son noticia. Más arriba aún, sólo el movimiento es noticia. Después, sólo los cambios en la dirección o velocidad del movimiento. En términos de Barlow, derivados de la teoría de códigos, podríamos decir que el sistema nervioso utiliza palabras cortas y económicas para mensajes que se dan frecuentemente y son esperables; palabras largas y caras para mensajes que se dan raramente y no son esperados. Es un poco como el lenguaje, en el que (la generalización se conoce como ley de Zipf) las palabras más cortas del diccionario son las que con más frecuencia se utilizan en el habla. Para llevar esta idea a un extremo, la mayor parte del tiempo el cerebro no necesita que se le diga nada, porque lo que está sucediendo es la norma. El mensaje sería redundante. El cerebro está protegido de la redundancia por una jerarquía de filtros, cada uno de ellos sintonizado para eliminar rasgos esperados de un tipo determinado.

De ahí se sigue que el conjunto de filtros nerviosos constituye un tipo de descripción sumaria de la norma, de las propiedades estadísticas del mundo en el que el animal vive. Es el equivalente nervioso de nuestra intuición del capítulo anterior: que los genes de una especie llegan a constituir una descripción estadística de los mundos en los que sus antepasados fueron seleccionados de forma natural. Ahora vemos que las unidades sensoriales codificadoras con las que el cerebro se enfrenta al ambiente constituyen asimismo una descripción estadística de dicho ambiente. Están sintonizadas para descontar lo común y resaltar lo raro. Nuestro hipotético zoólogo del futuro, por lo tanto, tiene que ser capaz, mediante la inspección del sistema nervioso de un animal desconocido y la medición de los sesgos estadísticos en su sintonización, de reconstruir las propiedades estadísticas del mundo en el que el animal vivió, de extraer lo que es común y lo que es raro en el mundo de dicho animal.

La inferencia sería indirecta, igual que en el caso de los genes. No leeríamos el mundo del animal como una descripción directa. En lugar de ello, inferiríamos cosas acerca del mundo del animal inspeccionando el glosario de abreviaciones que su cerebro usara para describirlo. A los funcionarios públicos les encantan los acrónimos tales como PAC (Política Agrícola Común) y CAICYT (Comisión Asesora de Investigación Científica y Técnica); los burócratas novatos necesitan ciertamente un glosario de tales abreviaturas, un libro de códigos. Si encontramos uno de tales libros de códigos en la calle, podemos averiguar de qué ministerio procede viendo qué frases se han abreviado, presumiblemente porque son de uso corriente en aquel ministerio. Un libro de códigos interceptado no es un mensaje concreto acerca del mundo, pero es un resumen estadístico del tipo de mundo para cuya descripción económica fue diseñado el código.

Podemos imaginar que cada cerebro está equipado con un aparador de imágenes básicas, útiles para modelar características importantes o comunes del mundo del animal. Aunque, siguiendo a Barlow, he destacado el aprendizaje como el medio por el que se abastece el aparador, no hay ninguna razón para que la propia selección natural, operando sobre los genes, no haga parte del trabajo de llenar el aparador. En este caso, siguiendo la lógica del capítulo anterior, podremos decir que el aparador del cerebro contiene imágenes del pasado ancestral de la especie. Podríamos denominarlo inconsciente colectivo, si la frase no estuviera empañada por asociación.

Pero los sesgos del juego de imágenes en la alacena no sólo reflejarán lo que es estadísticamente inesperado en el mundo. La selección natural asegurará que el repertorio de representaciones virtuales esté asimismo bien dotado con imágenes que son de particular prominencia o importancia en la vida del tipo concreto de animal y en el mundo de sus antepasados, aunque éstos no sean especialmente comunes. Un animal puede necesitar únicamente una vez en la vida reconocer un diseño complicado, pongamos por caso la forma de una hembra de su especie, pero en esta ocasión tiene una importancia vital que lo haga correctamente, y que lo haga sin demora. Para los seres humanos, las caras tienen una importancia especial, y al mismo tiempo son comunes en nuestro mundo. Lo mismo ocurre en los monos sociales. Se ha encontrado que el cerebro de los monos posee una clase especial de células que sólo disparan a toda potencia cuando se les presenta una cara completa. Ya hemos visto que los seres humanos con determinados tipos de lesiones cerebrales localizadas experimentan un tipo muy peculiar, y revelador, de ceguera selectiva. No pueden reconocer las caras. Pueden ver todo lo demás, aparentemente de manera normal, y pueden ver que una cara tiene una forma, con rasgos. Pueden describir la nariz, los ojos y la boca. Pero no pueden siquiera reconocer la cara de la persona a quien más quieren en el mundo. Las personas normales no sólo reconocen caras. Parece que tenemos un ansia casi indecente por verlas, estén realmente allí o no. Vemos caras en las manchas de humedad en el techo, en los contornos de una ladera (como las ilustraciones recogidas en Escalando el monte Improbable), en las nubes o en el relieve de Marte. Generaciones enteras de observadores de la Luna se han visto impulsados, por la menos prometedora de las materias primas, a inventar una cara en la pauta de cráteres sobre nuestro satélite. El Daily Express del 15 de enero de 1998 dedicaba más de una página completa, con titular a toda plana, a la historia de una mujer de la limpieza irlandesa que vio la cara de Jesús en su trapo para el polvo: «Ahora se espera que una riada de peregrinos acuda a su casa colindante… El sacerdote de la parroquia declaró que nunca había visto nada parecido en sus 34 años de sacerdocio». La fotografía acompañante muestra una mancha de pulimento sucio sobre un trapo que recuerda lejanamente una cara de algún tipo: hay una ligera indicación de un ojo a un lado de lo que podría ser una nariz; al otro lado se ve una ceja inclinada que le da cierto parecido con Haroíd MacMillan, el político conservador y primer ministro, aunque supongo que incluso Haroíd MacMillan podría parecerse a Jesús para una mente predispuesta. El Express nos recuerda historias parecidas, entre ellas el «bollo de monja» que se servía en un café de Nashville, el cual «se parecía a la cara de la Madre Teresa, de 86 años» y provocó un gran revuelo hasta que «la anciana monja escribió al café pidiendo que se retirara el bollo».

La avidez del cerebro por componer caras cuando se le ofrece el más mínimo estímulo promueve una notable ilusión. Consígase una máscara ordinaria de una cara humana: la cara del presidente Clinton, o cualquiera de las que se venden para los bailes de disfraces. Coloqúese derecha bajo una buena iluminación y mírese desde un lugar alejado de la habitación. Si se la mira en su posición normal convexa parece sólida, lo que no es sorprendente. Pero gírese ahora la máscara de manera que esté encarada en la dirección contraria al observador, y mírese el lado cóncavo desde el otro lado de la habitación. La mayoría de gente ve inmediatamente la ilusión. Si el lector no lo consigue, intente ajustar la luz. Puede ayudar si cierra un ojo, pero no es en absoluto necesario. La ilusión es que la cara convexa de la máscara parece cóncava. La nariz, las cejas y la boca se proyectan hacia el observador y parecen más cercanas que las orejas. Es incluso más sorprendente si uno se mueve de un lado a otro, o arriba y abajo. La cara, aparentemente maciza, parece girar con el observador, de una manera extraña, casi mágica.

No estoy hablando de la experiencia ordinaria que tenemos cuando los ojos de un buen retrato parece que nos sigan por toda la habitación. La ilusión de la máscara hueca es mucho más fantasmal. Parece flotar luminosamente en el espacio. Parece girar realmente. Tengo una máscara de la cara de Einstein montada en mi cuarto, por el lado cóncavo, y los visitantes se quedan boquiabiertos cuando la ven. La ilusión resulta más sorprendente aún si se instala la máscara en una plataforma giratoria que se mueve lentamente. A medida que la cara convexa gira ante uno, se la ve moverse al modo de «realidad normal». Pero después aparece la cara cóncava y ocurre algo extraordinario. Se ve otra cara maciza, pero que gira en la dirección opuesta. Puesto que una cara (por ejemplo, la cara real sólida) está girando en el sentido de las agujas del reloj mientras que la otra, la cara seudosólida, parece estar girando en el sentido contrario a las agujas del reloj, se diría que la cara que aparece a la vista girando se traga la cara que desaparece al girar. A medida que la rotación continúa, se puede ver la cara en realidad hueca pero aparentemente maciza, que gira firmemente en la dirección equivocada durante un momento, antes que la cara real reaparezca y se trague la cara virtual. Toda la experiencia de observar esta ilusión es bastante inquietante y sigue siéndolo por más que se siga mirándola durante largo tiempo. Uno no se acostumbra a ella y la ilusión no se pierde.

¿Qué es lo que sucede? Podemos plantear la respuesta en dos etapas. Primera, ¿por qué vemos la cara cóncava de la máscara como convexa? Segunda, ¿por qué parece girar en la dirección equivocada? Ya nos hemos puesto de acuerdo en que el cerebro es muy bueno a la hora de construir caras en su sala de simulación interna (y en que está ansioso por hacerlo). La información que los ojos están suministrando al cerebro es, desde luego, compatible con el hecho de que la máscara es hueca, pero también lo es (apenas) con una hipótesis alternativa: que es sólida. Y el cerebro, en su simulación, se inclina por la segunda alternativa, presumiblemente debido a su afán de ver caras. De manera que decide en contra del mensaje que le llega de los ojos y que dice: «Esto está vacío»; en lugar de ello, oye los mensajes que dicen: «Esto es una cara, esto es una cara, cara, cara, cara». Las caras son siempre convexas. De modo que el cerebro toma un modelo de cara de su alacena que es, por naturaleza, convexo.

Pero, después de haber construido su cara aparentemente convexa, el cerebro es cogido en una contradicción cuando la máscara empieza a girar. Para simplificar la explicación, supóngase que la máscara es la de Oliver Cromwell y que sus famosas arrugas son visibles desde ambos lados de la máscara. Cuando mira al interior vacío de la nariz, que en realidad se aleja del observador, el ojo mira directamente al lado derecho de la nariz, donde hay una verruga prominente. Pero la nariz virtual construida apunta aparentemente hacia el observador, no se aleja de él, y la verruga se encuentra en lo que, desde el punto de vista del Cromwell virtual, sería su lado izquierdo, como si estuviera mirando la imagen especular de Cromwell. A medida que la máscara gira, si la cara fuera realmente convexa nuestro ojo vería más del lado que esperaría ver más y menos del lado que esperaría ver menos. Pero puesto que la máscara está en realidad al revés, ocurre lo contrario. Las proporciones relativas de la imagen retiniana cambian de la manera que el cerebro esperaría si la cara fuera cóncava pero girara en la dirección opuesta. Y ésta es la ilusión que vemos. El cerebro resuelve la inevitable contradicción de la única manera posible, dada su tozuda insistencia en que la máscara es convexa: simula un modelo virtual de una cara que se traga otra cara.

El raro trastorno cerebral que destruye nuestra capacidad de reconocer caras se llama prosopagnosia. Es causado por lesiones en partes concretas del cerebro. Este mismo hecho apoya la importancia de un «aparador de caras» en el cerebro. No lo sé, pero apostaría a que los prosopagnósicos no pueden ver la ilusión de la máscara hueca. Francis Crick comenta la prosopagnosia en su libro La búsqueda científica del alma (1994), junto con otras condiciones clínicas reveladoras. Por ejemplo, un paciente encontró muy alarmante la siguiente condición, lo que, como observa Crick, no es sorprendente:

… objetos o personas que veía en un lado aparecían de repente en otro sin que ella tuviera conciencia de que se hubieran movido. Esto resultaba particularmente atemorizante si lo que deseaba era cruzar una calle, ya que un coche que en un principio parecía muy lejano de pronto se encontraba muy próximo… Su experiencia del mundo era más parecida a la que nosotros podemos experimentar en la pista de baile de una discoteca con luz estroboscópica.

Esta mujer poseía un almacén mental lleno de imágenes para ensamblar su mundo virtual, exactamente igual que hacemos todos nosotros. Es probable que las imágenes fueran perfectamente buenas. Pero algo había fallado en su programa para desplegarlas en un mundo virtual que cambiaba paulatinamente. Otros pacientes han perdido su capacidad de construir la profundidad virtual. Ven el mundo como si estuviera hecho de recortes planos de cartón. Y aún otros pacientes sólo pueden reconocer los objetos si se presentan en un ángulo familiar. El resto de nosotros, después de haber visto, pongamos por caso, una cacerola desde un lado, podemos reconocerla sin esfuerzo desde arriba. Estos pacientes han perdido presumiblemente una cierta capacidad de manipular imágenes virtuales y de hacerlas girar en cualquier sentido. La tecnología de la realidad virtual nos proporciona un lenguaje para pensar acerca de tales habilidades, y éste será el tema que presentaré a continuación.

No me entretendré en los detalles de la realidad virtual del momento, que con toda seguridad quedarán obsoletos. La tecnología cambia tan rápidamente como todo lo demás en el mundo de los ordenadores. Lo que ocurre esencialmente es lo que sigue. Uno se calza un casco que presenta a cada uno de los ojos una minúscula pantalla de ordenador. Las imágenes de las dos pantallas son casi las mismas, pero desalineadas para conferir la ilusión estereoscópica de las tres dimensiones. La escena es la que se haya programado en el ordenador: quizá el Partenón, intacto y en sus colores chillones originales; un paisaje marciano imaginado; el interior de una célula, enormemente aumentado. Hasta aquí, yo podía estar describiendo un filme ordinario en 3-D. Pero la máquina de realidad virtual proporciona una calle de dos direcciones. El ordenador no sólo nos presenta escenas, sino que responde a nuestras indicaciones. El casco está conectado de manera que registre todos los giros de nuestra cabeza y otros movimientos corporales que, en el curso normal de los acontecimientos, afectarían a nuestro punto de vista. El ordenador está informado continuamente de todos estos movimientos y (aquí está la parte ingeniosa) está programado para cambiar la escena presentada a los ojos, exactamente de la manera en que cambiaría si uno estuviera moviendo realmente la cabeza. Cuando uno gira la cabeza, las columnas del Partenón, pongamos por caso, giran alrededor y uno se encuentra mirando una estatua que antes estaba «detrás» de uno.

Un sistema más avanzado puede consistir en un vestido ajustado como una media y dotado de válvulas de tensión que supervisan las posiciones de todas nuestras extremidades. El ordenador puede saber ahora cuándo damos un paso, nos sentamos, nos levantamos o agitamos los brazos. Ahora podemos andar de un extremo al otro del Partenón y ver cómo las columnas pasan por nuestro lado a medida que el ordenador cambia las imágenes en simpatía con nuestros pasos. Hay que andar con cuidado, porque, recuérdese, no estamos realmente en el Partenón, sino en una sala de ordenadores atestada. Los sistemas de realidad virtual actuales, efectivamente, es probable que lo conecten a uno al ordenador mediante un complicado cordón umbilical de cables, de modo que postularemos una conexión futura desprovista de enredos, mediante radio, o un haz de datos de radiación infrarroja. Ahora se puede andar libremente en un mundo real vacío y explorar el mundo virtual de fantasía que nos han programado. Puesto que el ordenador sabe donde está el vestido ajustado, no hay ninguna razón por la que no pueda representar nuestro cuerpo para nosotros como una forma humana completa, un avatar,[33] lo que nos permite mirar nuestras «piernas», que pueden ser muy distintas de las piernas reales. Podemos mirar nuestras manos de avatar mientras se mueven en imitación de nuestras manos reales. Si utilizamos estas manos para coger un objeto virtual, por ejemplo una urna helenística, la urna parecerá ascender en el aire mientras la «levantamos».

Si alguna otra persona, que puede hallarse en otro país, calza otro conjunto de avíos conectado al mismo ordenador, en principio uno puede ser capaz de ver a su avatar e incluso de estrecharle la mano, aunque con la tecnología actual podemos encontramos que cada uno pasa a través del otro como fantasmas. Técnicos y programadores están trabajando todavía en la manera de crear la ilusión de textura y la «sensación» de resistencia sólida. Cuando visité la principal compañía de realidad virtual de Inglaterra, me contaron que reciben muchas cartas de personas que desean una pareja sexual virtual. Es posible que, en el futuro, amantes separados por el Atlántico puedan acariciarse a través de Internet, aunque incomodados por la necesidad de llevar guantes y un vestido ajustado conectado a válvulas de tensión y almohadillas de presión.

Situemos ahora la realidad virtual un poco más lejos de los sueños y más cerca de la utilidad práctica. Los médicos de hoy se valen del ingenioso endoscopio, un refinado tubo que se inserta en el cuerpo de un paciente a través de la boca o el recto y que es utilizado para el diagnóstico e incluso para la intervención quirúrgica. Mediante el equivalente de tirar de alambres, el cirujano dirige el largo tubo a través de los recodos del intestino. El mismo tubo tiene una minúscula cámara de televisión en su extremo y un tubo de luz para iluminar el camino. El extremo del tubo puede dotarse asimismo de varios instrumentos de control remoto que el cirujano puede controlar, como microescalpelos y pinzas.

En la endoscopia convencional, el cirujano ve lo que está haciendo mediante el uso de una pantalla ordinaria de televisión, y opera los controles remotos utilizando sus dedos. Pero, como han advertido varios autores (entre ellos Jaron Lanier, que fue quien acuñó la expresión «realidad virtual»), es en principio posible transmitir al cirujano la ilusión de que se ha encogido y se encuentra realmente dentro del cuerpo del paciente. Esta idea está en fase de investigación, de manera que me valdré de una fantasía sobre cómo puede funcionar la técnica en el siglo que viene. La cirujana del futuro no tiene ninguna necesidad de lavarse y restregarse manos y brazos, porque no necesita acercarse a su paciente. Se sitúa en una zona amplia y abierta, conectada por radio al endoscopio que hay en el interior del intestino del paciente. Las pantallas en miniatura que tiene frente a sus dos ojos le presentan una imagen estereoscópica aumentada del interior del paciente justo delante del endoscopio. Cuando la cirujana mueve su cabeza hacia la izquierda, el ordenador hace girar automáticamente la punta del endoscopio hacia la izquierda. El ángulo de visión de la cámara en el interior del intestino se mueve fielmente para seguir los movimientos de la cabeza de la cirujana en los tres planos. Ésta hace que el endoscopio avance a lo largo del intestino mediante sus pasos. Lentamente, para no dañar al paciente, el ordenador empuja el endoscopio hacia adelante, y su dirección está controlada siempre por la dirección en la que, en una habitación completamente distinta, la cirujana camina. Ella siente como si realmente estuviera andando por el interior del intestino. Ni siquiera siente claustrofobia. Siguiendo la práctica endoscópica actual, el intestino ha sido cuidadosamente hinchado con aire, pues de otro modo las paredes presionarían a la cirujana y la obligarían a arrastrarse en vez de caminar.

Cuando encuentra lo que busca, por ejemplo un tumor maligno, la cirujana selecciona un instrumento de su bolsa de herramientas virtual. Quizá lo más conveniente sea modelarlo como una sierra de cadena, cuya imagen es generada en el ordenador. Mientras mira el tumor, aumentado y en tres dimensiones, a través de las pantallas estereoscópicas de su casco, la cirujana ve la sierra de cadena virtual en sus manos y se dispone a trabajar, extirpando el tumor, como si se tratara de un tocón de árbol que hay que arrancar del jardín. En el interior del paciente real, el equivalente especular de la sierra de cadena es un haz de láser ultrafino. Como si fuera a través de un pantógrafo, los movimientos grandes de todo el brazo de la cirujana cuando levanta la sierra son reducidos, a través del ordenador, al equivalente de los minúsculos movimientos del cañón láser que hay en la punta del endoscopio.

Para mi propósito sólo necesito decir que es teóricamente posible crear la ilusión de andar a través del intestino de alguien utilizando las técnicas de la realidad virtual. No sé si esto ayudará realmente a los cirujanos. Sospecho que sí, aunque un asesor clínico al que he consultado es un poco escéptico. Este mismo cirujano se refiere a él mismo y a sus colegas gastroenterólogos como fontaneros glorificados. Precisamente, los fontaneros utilizan versiones a gran escala de los endoscopios para explorar tuberías, y en Norteamérica incluso envían «cerdos» mecánicos para que se abran camino a través de las obstrucciones de los drenajes. Es evidente que los métodos que imaginé para un cirujano funcionarían también para un fontanero. El fontanero podría «caminar» (¿o «nadar»?) a lo largo de la tubería de agua virtual con una lámpara de minero virtual en su casco y con un pico virtual en su mano para eliminar las obstrucciones.

El Partenón de mi primer ejemplo no existía en ningún otro lugar que el ordenador. El ordenador podría habernos presentado ángeles, arpías o unicornios alados. Mi endoscopista y mi fontanero hipotéticos, en cambio, andaban a través de un mundo virtual que estaba obligado a parecerse a una porción cartografiada de la realidad, el interior real de un drenaje o el intestino de un paciente. El mundo virtual que aparecía ante la cirujana en sus pantallas estereoscópicas, hay que admitirlo, estaba construido en un ordenador, pero lo estaba de una manera disciplinada. Había un cañón láser real que era controlado, aunque se presentaba como una sierra de cadena porque ésta se sentiría como una herramienta natural para extirpar un tumor cuyo tamaño aparente era comparable al cuerpo de la propia cirujana. La forma de la construcción virtual reflejaba, de la manera más conveniente para la operación de la cirujana, un detalle del mundo real del interior del paciente. Dicha realidad virtual forzada es esencial en este capítulo. Creo que cada especie que posee un sistema nervioso la utiliza para construir un modelo de su propio mundo particular, forzado por la continua puesta al día a través de los órganos de los sentidos. La naturaleza del modelo puede depender de la manera en que la especie implicada lo utilizará, al menos tanto como de nuestra concepción de la naturaleza del mundo mismo.

Piénsese en una gaviota que planea diestramente dejándose llevar por el viento en lo alto de un acantilado sobre el mar. Puede que no bata las alas, pero esto no significa que sus músculos alares estén ociosos. Éstos, y los de la cola, están realizando constantemente ajustes minúsculos, adaptando de manera sensible y fina las superficies de vuelo del ave a cada remolino, cada matiz del aire a su alrededor. Si alimentamos un ordenador con la información sobre el estado de todos los nervios que controlan estos músculos, en cada momento, el ordenador podría en principio reconstruir cada detalle de las corrientes de aire a través de las cuales el ave se deslizaba. Lo haría suponiendo que la gaviota estaba bien diseñada para permanecer en el aire, y sobre esta suposición construiría un modelo continuamente puesto al día del aire a su alrededor. Sería un modelo dinámico, como el modelo que hace un hombre del tiempo del sistema meteorológico mundial, que es continuamente revisado por los nuevos datos que suministran los buques meteorológicos, los satélites y las estaciones meteorológicas en tierra y puede extrapolarse para predecir el futuro. El modelo meteorológico nos informa del tiempo que hará mañana; el modelo de la gaviota es teóricamente capaz de «informar» al ave sobre los movimientos anticipatorios que deben ejecutar los músculos de las alas y la cola con el fin de planear en el segundo siguiente.

El punto hacia el que nos estamos abriendo paso es, desde luego, que aunque ningún programador humano ha construido todavía un modelo de ordenador para informar a las gaviotas de cómo ajustar sus músculos alares y caudales, es seguro que un modelo de este tipo está funcionando continuamente en el cerebro de nuestra gaviota y de cualquier otra ave en vuelo. Modelos similares, preprogramados a grandes rasgos por los genes y la experiencia previa, y que están siendo puestos continuamente al día por nuevos datos sensoriales de milisegundo en milisegundo, están en marcha en el interior del cráneo de cada pez que nada, de cada caballo que galopa, de cada murciélago que detecta su entorno mediante el eco.

Paúl MacCready es un ingenioso inventor conocido por sus máquinas voladoras espléndidamente económicas, Gossamer Cóndor y Gossamer Albatross, que son de propulsión humana, y Solar Challenger, propulsada mediante energía solar.[34] Asimismo, en 1985 construyó una réplica volante de Quetzalcoatius, un pterosaurio gigante del Cretácico. Este enorme reptil volador, con una envergadura alar comparable a la de una avioneta, carecía casi de cola y, por lo tanto, era muy inestable en el aire.[35] John Maynard Smith, que se formó como ingeniero aeronáutico antes de pasarse a la zoología, señaló que esto le habría conferido ventajas de maniobrabilidad, pero exigía un control preciso y constante de las superficies de vuelo. Sin un ordenador rápido para ajustar continuamente su compensación, la réplica de MacCready se habría estrellado. El Quetzalcoatius real debía tener un ordenador equivalente en su cabeza, por la misma razón. Los primeros pterosaurios tenían una cola larga, en algunos casos terminada en lo que parece una paleta de ping-pong, que les habría conferido gran estabilidad a costa de la maniobrabilidad. Parece que en la evolución de pterosaurios posteriores casi sin cola como Quetzalcoatius hubo un cambio de estable pero poco maniobrable a maniobrable pero inestable. La misma tendencia puede verse en la evolución de los aviones construidos por el hombre. En ambos casos, la tendencia sólo es posible aumentando la potencia del ordenador. Como en el caso de la gaviota, el ordenador de a bordo del pterosaurio, en el interior de su cráneo, tuvo que hacer funcionar un modelo de simulación del animal y del aire a través del cual volaba.

El lector y yo, nosotros, somos humanos, somos mamíferos, somos animales, habitamos en un mundo virtual, construido a partir de elementos que son, a niveles sucesivamente más altos, útiles para representar el mundo real. Desde luego, nos sentimos como si estuviéramos firmemente instalados en el mundo real… que es exactamente como debe ser si nuestro programa de realidad virtual limitada debe servir para algo. Sirve para mucho, porque es muy bueno, y sólo nos damos cuenta de él en las raras ocasiones en las que algo no funciona bien.

Cuando ocurre tal cosa experimentamos una ilusión o una alucinación, como la ilusión de la máscara hueca antes mencionada.

El psicólogo británico Richard Gregory ha prestado una atención especial a las ilusiones visuales como medio para estudiar el funcionamiento del cerebro. En su libro Ojo y cerebro (5a edición inglesa de 1998) considera que la visión es un proceso activo en el que el cerebro establece hipótesis acerca de lo que está ocurriendo ahí fuera, y después contrasta dichas hipótesis con los datos que le llegan desde los órganos de los sentidos. Una de las ilusiones visuales más conocidas es el cubo de Necker. Se trata del dibujo de un cubo hueco mediante una línea sencilla, como un cubo hecho con varillas de acero. El dibujo es una forma bidimensional de tinta sobre papel. Pero un ser humano normal lo ve como un cubo. El cerebro ha creado un modelo tridimensional basado en el modelo bidimensional sobre el papel. En realidad, éste es el tipo de cosa que el cerebro hace casi cada vez que miramos una imagen. La forma plana de la tinta sobre el papel es igualmente compatible con dos modelos cerebrales tridimensionales alternativos. Obsérvese el dibujo durante unos segundos y se verá cómo da una vuelta de campana. La faceta que previamente parecía estar más cerca del observador parece encontrarse ahora más lejos. Continúese observando, y cambiará de nuevo al cubo original. El cerebro podría haber sido diseñado para adoptar, arbitrariamente, uno de los dos modelos de cubo, pongamos por caso el primero que vio, aunque el otro modelo habría sido igualmente compatible con la información procedente de las retinas. Pero de hecho el cerebro adopta la otra opción de hacer funcionar cada modelo, o hipótesis, alternativamente durante unos cuantos segundos cada vez. De ahí los estados alternos del cubo aparente, lo que descubre las cartas. Nuestro cerebro construye un modelo tridimensional. Es realidad virtual en la cabeza.

Cuando miramos una caja de madera de verdad, a nuestro programa de simulación se le proporciona información adicional que le permite llegar a una preferencia clara por uno de los dos modelos internos. Por ello vemos la caja sólo de una manera, y no hay alternancia. Pero ello no minimiza la verdad de la lección general que nos enseña el cubo de Necker. Siempre que miramos algo, hay un sentido en el que lo que nuestro cerebro utiliza realmente es un modelo cerebral de este algo. El modelo del ejemplo, como el Partenón de mi primer ejemplo, es construido. Pero, a diferencia del Partenón (y quizá de las visiones que vemos en sueños), y como el modelo de ordenador de la cirujana del interior de su paciente, no es totalmente inventado: está forzado por la información que le suministra el mundo exterior.

Una ilusión más potente de solidez es la que transmite la estereoscopia, la ligera discrepancia entre las dos imágenes que captan los ojos derecho e izquierdo. Es esto lo que se explota en las dos pantallas de un casco de realidad virtual. Mantenga el lector su mano derecha, con el pulgar dirigido hacia él, a una distancia de unos 30 centímetros de su cabeza, y mire algún objeto distante, por ejemplo un árbol, con ambos ojos abiertos. Verá dos manos. Corresponden a las imágenes que ven los dos ojos. El lector puede descubrir rápidamente a qué ojo corresponde cada imagen cerrando primero un ojo y después el otro. Las dos manos parecen hallarse en lugares ligeramente distintos, porque los dos ojos convergen desde ángulos distintos y las imágenes en las dos retinas son en consecuencia diferentes, y lo son de forma reveladora. También los dos ojos tienen una visión ligeramente distinta de la mano. El ojo izquierdo ve un poco más de la palma, el derecho un poco más del dorso.

Ahora, en vez de mirar al árbol distante, mírese el lector la mano, de nuevo con ambos ojos. En lugar de dos manos en primer término y un árbol en segundo plano, verá una mano de aspecto macizo y dos árboles. Pero la imagen de la mano sigue proyectándose sobre lugares distintos de las dos retinas del lector. Lo que esto significa es que el programa de simulación del lector ha fabricado un único modelo de la mano, un modelo en tres dimensiones. Más aún, el modelo tridimensional único ha utilizado información procedente de ambos ojos. El cerebro amalgama sutilmente ambos conjuntos de información y compone un modelo útil de una mano sólida, única y tridimensional. Incidentalmente, todas las imágenes retinianas, desde luego, están cabeza abajo, pero esto no importa porque el cerebro construye su modelo de simulación de la manera que mejor se ajusta a su propósito y define este modelo como el que se encuentra en la posición adecuada.

Los ardides computacionales que utiliza el cerebro para construir un modelo tridimensional a partir de las imágenes bidimensionales son sorprendentemente refinados, y son la base de la que quizá sea la más impresionante de todas las ilusiones. Esto se remonta a un descubrimiento del psicólogo húngaro Bela Julesz en 1959. Un estereoscopio normal presenta la misma fotografía al ojo derecho y al izquierdo, pero tomadas desde ángulos adecuadamente distintos. El cerebro junta ambas imágenes y ve una escena impresionantemente tridimensional. Julesz hizo lo mismo, salvo que sus imágenes eran puntos mosqueteados aleatorios. Al ojo izquierdo y al derecho se les presentaba el mismo patrón aleatorio, pero con una diferencia crucial. En un experimento típico de Julesz, una superficie del modelo, por ejemplo un cuadrado, tenía sus puntos aleatorios desplazados a un lado, la distancia apropiada para crear la ilusión estereoscópica. Y el cerebro ve la ilusión (aparece una mancha cuadrada) aunque no haya ni la más ligera traza de cuadrado en ninguna de las dos imágenes. El cuadrado se presenta sólo en la discrepancia entre las dos imágenes. El cuadrado parece muy real al observador, pero realmente no se encuentra en parte alguna, salvo en el cerebro. El efecto Julesz es la base de las ilusiones del «ojo mágico» tan populares en la actualidad. En un tour de forcé del arte del explicador, Steven Pinker dedica una pequeña sección de How the Mind Works (1998) al principio en el que se basan estas imágenes. No voy a intentar siquiera mejorar su explicación.

Hay una manera fácil de demostrar que el cerebro funciona como un refinado ordenador de realidad virtual. En primer lugar, mire el lector a su alrededor moviendo los ojos. A medida que los ojos giran, las imágenes en las retinas del lector se mueven como si éste estuviera en pleno terremoto. Pero el lector no ve un terremoto. Para él, la escena parece tan firme como una roca. Desde luego, estoy preparando el terreno para decir que el modelo virtual en nuestro cerebro está construido para permanecer firme. Pero aquí no acaba la demostración, porque hay otra manera de hacer que la imagen en la retina del lector se mueva. Golpee ligeramente el lector uno de sus globos oculares a través de la piel del párpado. La imagen en la retina se moverá de la misma manera que antes. De hecho, el lector puede, si tiene la destreza suficiente con su dedo, imitar el efecto de girar la vista. Pero ahora pensará realmente que ve moverse la tierra. Toda la escena se desplaza, como si se estuviera presenciando un terremoto.

¿Cuál es la diferencia entre los dos casos? Ese ordenador que es el cerebro ha sido programado para tener en cuenta los movimientos normales del ojo y tomarlos en consideración a la hora de construir su modelo computado del mundo. Aparentemente, el modelo cerebral utiliza la información procedente no sólo de los ojos, sino también de las instrucciones para mover los ojos. Siempre que el cerebro emite una orden a los músculos oculares para que muevan el ojo, una copia de esta orden es enviada a la parte del cerebro que está construyendo el modelo interno del mundo. Después, cuando los ojos se mueven, el programa de realidad virtual del cerebro es avisado de que espere que las imágenes retinianas se muevan exactamente en la cantidad justa, y hace que el modelo compense el movimiento. De modo que se ve que el modelo construido del mundo permanece quieto, aunque puede verse desde otro ángulo. Si la tierra se mueve en cualquier otro momento que no sea aquel en el que al modelo se le dice que espere movimiento, el modelo virtual se comporta en consecuencia. Esto está muy bien, porque puede que realmente haya un terremoto. Excepto que uno puede engañar al sistema golpeando el globo ocular. Como demostración final en la que se utiliza al lector como conejillo de Indias, éste puede girar muchas veces sobre sí mismo hasta aturdirse. Después, deténgase y mire fijamente el mundo. Parecerá que éste gira, aunque la razón le dice al lector que se trata de una rotación que no lo lleva a ninguna parte. Las imágenes retinianas no se están moviendo, pero los acelerómetros de sus oídos (que funcionan detectando los movimientos de fluido en los llamados canales semicirculares) están diciéndole al cerebro que el lector está girando. El cerebro instruye al programa de realidad virtual para que espere ver que el mundo está rotando. Cuando las imágenes de la retina no giran, el modelo registra la discrepancia y gira él mismo en la dirección opuesta. Expresándolo en lenguaje subjetivo, el equipo lógico de realidad virtual se dice: «Sé que estoy girando por lo que los oídos me están diciendo; por lo tanto, para que el modelo permanezca quieto, será necesario introducir en éste la rotación en sentido contrario, en relación a los datos que los ojos están enviando». Pero las retinas no informan realmente de ningún giro, de modo que lo que parece que vemos es el giro compensador del modelo que hay en la cabeza. En términos de Barlow, es lo inesperado, es «noticia», y ésta es la razón por la que lo vemos.

Las aves tienen un problema adicional del que los seres humanos normalmente están libres. Un ave posada en la rama de un árbol está siendo zarandeada continuamente arriba y abajo, a uno y otro lado, y sus imágenes retinianas se balancean del mismo modo. Es como vivir en un terremoto permanente. Las aves mantienen firme su cabeza, y con ella su visión del mundo, mediante el uso diligente de los músculos del cuello. Si uno filma a un pájaro en una rama azotada por el viento, casi se puede imaginar que la cabeza está clavada al fondo, mientras que los músculos del cuello utilizan la cabeza como fulcro para mover el resto del cuerpo. Cuando un ave camina, emplea el mismo truco para mantener firme el mundo que percibe. Ésta es la razón por la que, cuando caminan, las gallinas mueven bruscamente la cabeza hacia delante y hacia atrás de una manera que puede parecemos bastante cómica. En realidad, es bastante ingeniosa. Cuando el cuerpo se mueve hacia delante, el cuello tira de la cabeza hacia atrás de una manera controlada, para que las imágenes retinianas permanezcan fijas. Después la cabeza sale disparada hacia delante para permitir que el ciclo se repita. No puedo evitar pensar en la posibilidad de que, como una consecuencia desagradable de esta manera que tienen las aves de hacer las cosas, un ave sea incapaz de ver un terremoto real porque sus músculos del cuello lo compensarían automáticamente. Ya más en serio, podríamos decir que el ave está utilizando sus músculos del cuello en un ejercicio al estilo de Barlow: mantener constante la parte no noticiable del mundo, de manera que destaque el movimiento genuino.

Los insectos y muchos otros animales parecen tener un hábito parecido de actuar para mantener constante su mundo visual. Los investigadores lo han demostrado en un llamado «aparato optomotor», en el que un insecto es colocado sobre una mesa, rodeado por un cilindro vacío cuyo interior está pintado con bandas verticales. Si se hace girar el cilindro, el insecto utilizará sus patas para dar vueltas, manteniéndose en la misma posición con respecto al cilindro. Está actuando para mantener su mundo visual constante.

Normalmente, un insecto debe decirle a su programa de simulación que espere movimiento cuando anda, pues de otro modo empezaría por compensar sus propios movimientos y entonces, ¿dónde estaría? Esta idea hizo que dos ingeniosos investigadores alemanes, Erich von Holst y Horst Mittelstaedt, prepararan un experimento diabólicamente astuto. Si el lector ha visto alguna vez la manera en que una mosca se lava la cara con las manos, sabrá que las moscas son capaces de girar completamente la cabeza, invirtiendo su posición. Von Holst y Mittelstaedt consiguieron fijar la cabeza de una mosca en posición invertida con pegamento. El lector habrá adivinado ya la consecuencia. Normalmente, cada vez que una mosca hace girar su cuerpo, el modelo en su cerebro es informado de que espere un movimiento equivalente del mundo visual. Pero tan pronto como dio un paso, la desdichada mosca con la cabeza al revés recibió datos que sugerían que el mundo se había desplazado en la dirección opuesta a la esperada. Por lo tanto movió sus patas en la misma dirección con el fin de compensar. Esto hizo que la posición aparente del mundo cambiara todavía más. La mosca acabó girando sobre sí misma como una peonza, a una velocidad creciente… bueno, dentro de límites prácticos evidentes.

El mismo Erich von Holst señaló asimismo que es esperable una confusión similar si nuestras propias instrucciones voluntarias para mover los ojos se ven neutralizadas, por ejemplo narcotizando los músculos motores de los ojos. Normalmente, si uno da a los ojos la orden de moverse hacia la derecha, las imágenes retinianas indicarán un movimiento hacia la izquierda. Para compensar y crear la apariencia de estabilidad, el modelo en la cabeza tiene que moverse hacia la derecha. Pero si los músculos motores de los ojos están narcotizados, el modelo se moverá hacia la derecha en anticipación de lo que resulta ser un movimiento retiniano no existente. Dejemos que sea el propio Von Holst quien termine el relato, en su artículo «La fisiología del comportamiento de los animales y el hombre» (1973):

¡Y esto es precisamente lo que ocurre! Se ha sabido desde hace muchos años a partir de personas con los músculos oculares paralizados, y se ha establecido de manera exacta a partir de los experimentos de Kommuller sobre sí mismo, que cada movimiento del ojo que se intenta pero que no se cumple resulta en la percepción de un movimiento cuantitativo del entorno en la misma dirección.

Estamos tan acostumbrados a vivir en nuestro mundo simulado, y éste se mantiene de manera tan magnífica en sincronía con el mundo real, que no nos damos cuenta de que es un mundo simulado. Hacen falta experimentos ingeniosos, como los de Von Holst y sus colegas, para convencemos.

Ello tiene su lado oscuro. Un cerebro que es bueno a la hora de simular modelos en la imaginación corre también, de manera casi inevitable, el peligro de autoengañarse. ¿Cuántos de nosotros, siendo niños, hemos permanecido en la cama, aterrorizados porque pensábamos haber visto un fantasma o una cara monstruosa que nos miraba desde la ventana del dormitorio, para descubrir después que sólo era una jugarreta que nos había hecho la luz? Ya he comentado con qué vehemencia el programa de simulación de nuestro cerebro construye una cara maciza allí donde en realidad hay una cara hueca. Con la misma facilidad produce una cara fantasmagórica a partir de lo que realmente es una colección de pliegues iluminados por la luna en una cortina de tul blanco.

Cada noche de nuestra vida soñamos. Nuestro programa de simulación pone en marcha mundos que no existen; personas, animales y lugares que nunca existieron, que quizá nunca existirán. En el momento de experimentarlas, estas simulaciones son percibidas por nosotros como si fueran realidad. ¿Por qué no habríamos de percibirlas así, dado que habitualmente experimentamos la realidad de la misma manera, como modelos de simulación? El programa de simulación también puede engañamos cuando estamos despiertos. Las ilusiones como la cara vacía son inofensivas en sí mismas, y comprendemos como funcionan. Pero nuestro programa de simulación puede asimismo, si estamos drogados, o con fiebre, o hemos ayunado, producir alucinaciones. A lo largo de la historia, las personas han tenido visiones de ángeles, santos y dioses; y les han parecido muy reales. Bueno, desde luego, tenían que parecer reales. Son modelos, que el programa de simulación normal ha ensamblado. El programa de simulación utiliza las mismas técnicas de modelado que usa normalmente cuando presenta su edición continuamente puesta al día de la realidad. No es extraño que estas visiones hayan tenido tanta influencia. No es extraño que hayan cambiado la vida de la gente. De modo que si alguna vez oímos una historia acerca de que alguien ha tenido una visión, ha sido visitado por un arcángel, o bien ha oído voces en la cabeza, hemos de tener de inmediato sospechas de tomarlo al pie de la letra. Recuérdese que nuestra cabeza contiene un programa potente y ultrarrealista de simulación. Nuestro programa de simulación podría invocar en un dos por tres y de forma completa a un fantasma, un dragón o una virgen santa. Sería un juego de niños para un programa tan sofisticado.

Una palabra de aviso. La metáfora de la realidad virtual es seductora y, en muchos aspectos, adecuada. Pero existe el peligro de que nos haga pensar, erróneamente, que existe un «hombrecillo» u «homúnculo» en el cerebro, contemplando el espectáculo de realidad virtual. Tal como han señalado filósofos como Daniel Dennett, uno no ha explicado nada precisamente si se sugiere que el ojo está conectado al cerebro de tal manera que una pequeña pantalla de cine, en algún lugar del cerebro, retransmite todo lo que se proyecta sobre la retina. ¿Quién mira la pantalla? La cuestión así planteada no es menor que la pregunta original a la que uno piensa haber dado respuesta. Se podría hacer que el hombrecillo mirara directamente a la retina, lo que claramente no es una solución de nada. El mismo problema surge si tomamos literalmente la metáfora de la realidad virtual e imaginamos que algún agente situado dentro de la cabeza está «experimentando» la demostración de realidad virtual.

Los problemas que plantea la conciencia subjetiva son quizá los más desconcertantes de toda la filosofía, y resolverlos se aparta muchísimo de mi ambición. Mi sugerencia, más modesta, es que cada especie, en cada situación, necesita desplegar su información sobre el mundo de la manera que le sea más útil para emprender la acción. «Construir un modelo en la cabeza» es una manera útil de expresar de qué manera se hace esto, y compararla con la realidad virtual es especialmente útil en el caso de los seres humanos. Como he argumentado anteriormente, es probable que el modelo del mundo que utiliza un murciélago sea similar al modelo utilizado por una golondrina, aunque uno esté conectado al mundo real a través del oído y el otro a través de la vista. El cerebro construye su mundo modelo de la manera más adecuada para la acción. Puesto que las acciones de las golondrinas que vuelan de día y de los murciélagos que vuelan de noche son similares (navegar a gran velocidad en tres dimensiones, evitar obstáculos sólidos y capturar insectos al vuelo) es probable que utilicen los mismos modelos. No postulo «un pequeño murciélago en la cabeza» o «una pequeña golondrina en la cabeza» que observe el modelo. De algún modo, el modelo es utilizado para controlar los músculos del vuelo, y no iré más allá de esto.

No obstante, cada uno de nosotros, seres humanos, sabe que la ilusión de un agente único situado en algún lugar en medio del cerebro es muy potente. Sospecho que el caso puede ser paralelo al modelo de los «cooperadores egoístas», de los genes que aparecen juntos, aunque son agentes fundamentalmente independientes, para crear la ilusión de un cuerpo unitario. Volveré brevemente a esta idea hacia el final del próximo capítulo.

Este capítulo ha desarrollado la tesis de que el cerebro se ha apoderado de parte del papel de registrar el ambiente que tiene el ADN; de los ambientes, más bien, porque son muchos y se extienden en el pasado reciente y el distante. Poseer un registro del pasado es útil sólo en la medida en que ayude a predecir el futuro. El cuerpo del animal representa un tipo de predicción de que el futuro se parecerá al pasado ancestral, a grandes rasgos. Es probable que el animal sobreviva en la medida en que esto resulte ser cierto; y los modelos de simulación del mundo permiten que el animal actúe como anticipándose a lo que es probable que el mundo arroje en su camino en los segundos, horas o días inmediatos. Para completar el cuadro debemos señalar que el propio cerebro, y su programa de realidad virtual, son en último término producto de la selección natural de genes ancestrales. Podemos decir que los genes pueden predecir sólo hasta cierto punto, porque el futuro se parecerá al pasado sólo de manera general. Para los detalles y las sutilezas, dotan al animal de una circuitería nerviosa y un programa de realidad virtual que constantemente pondrán al día y revisarán sus predicciones para adaptarse a cambios rápidos en las circunstancias. Es como si los genes dijeran: «Podemos modelar la forma básica del ambiente, las cosas que no cambian a lo largo de las generaciones. Pero para los cambios rápidos, te toca a ti, cerebro».

Nos desplazamos por un mundo virtual que ha producido nuestro propio cerebro. Nuestros modelos artificiales de rocas y árboles son parte del ambiente en que vivimos nosotros, animales, no menos que las rocas y los árboles reales que representan. Y, cosa intrigante, nuestros mundos virtuales deben verse asimismo como parte del ambiente en el que nuestros genes son seleccionados naturalmente. Hemos representado los genes de camello como habitantes de mundos ancestrales, seleccionados para sobrevivir en antiguos desiertos y mares todavía más antiguos, seleccionados para sobrevivir en camaradería con colectivos compatibles de otros genes de camello. Todo esto es cierto, y de nuestros genes podrían contarse relatos equivalentes de árboles miocénicos y sabanas pliocénicas. Lo que ahora debemos añadir es que, entre los mundos en los que los genes han sobrevivido, hay mundos virtuales fabricados en el interior de cerebros ancestrales.

En el caso de animales muy sociales como nosotros mismos y nuestros antepasados, nuestros mundos virtuales son, al menos en parte, construcciones de grupo. Especialmente desde la invención del lenguaje y el auge de los artefactos y la tecnología, nuestros genes han tenido que sobrevivir en mundos complejos y cambiantes para los que la descripción más económica que podemos encontrar es la de realidad virtual compartida. Resulta una idea sorprendente el que, del mismo modo que se puede decir que los genes sobreviven en desiertos o selvas, e igual que se puede decir que sobreviven en compañía de otros genes en el acervo genético, también puede decirse que sobreviven en los mundos virtuales, incluso poéticos, creados por el cerebro. En el capítulo final nos dedicaremos al enigma del cerebro humano.