¿CÓMO SABER SI HAY UN MENSAJE?

Señales incomprensibles

Como ya hemos visto, las ondas de radio parecen ser unas excelentes candidatas para la comunicación interplanetaria, debido a que la Galaxia es muy transparente a ellas. Pero el problema radica en primer lugar en cómo distinguir si la señal que nos llega es artificial o natural. Cuando sintonizamos un receptor de radio y dirigimos su antena al cosmos, recogemos cientos de señales diferentes. Algunas de ellas son muy sugerentes, y pese a su origen natural, al oírlas uno está casi tentado de creer que se trata de emisiones de otras civilizaciones.

Éste es el caso de los chorus de la ionosfera, ondas de radio producidas por vibraciones naturales de los cinturones de Van Allen de la Tierra, y que resultan en bellos (y espeluznantes) cantos de sirena, fácilmente sintonizables en torno a los 10 kHz por una radio de onda larga. Cuando el Sol está especialmente activo y se producen las auroras, los chorus son más intensos y fáciles de escuchar. Estas emisiones de la ionosfera tienen además el honor de haber sido las primeras emisiones de radio captadas por el hombre, pues fueron escuchados por primera vez en los cables de telefonía y telegrafía en torno a 1880.

Otro ejemplo fácilmente confundible del que ya hemos hablado es el de los púlsares, estrellas de neutrones en rápida rotación que desde la Tierra se detectan como pulsos periódicos de ondas de radio, un «plop plop plop plop…» que resuena claro en el silencio de la noche galáctica. Su periodicidad es tan exacta que los podemos usar para comprobar la precisión de nuestro reloj de pulsera.

Es posible que la primera emisión que detectemos proveniente de una inteligencia extraterrestre sea una señal en su lenguaje natural, una fuga involuntaria de las transmisiones que esa civilización esté utilizando internamente. Es decir, que lo que escuchemos antes de ellos no sea un sofisticado mensaje diseñado por científicos extraterrestres para comunicarse con otras inteligencias, sino más bien el equivalente de un programa de radio o televisión, emitido para uso o disfrute propio, que desde su planeta haya escapado al espacio exterior, de igual forma que lo están haciendo los nuestros. Semejante señal, no diseñada para ser descifrada, sin duda resultará incomprensible. Pero también incomprensibles nos resultan las emisiones aleatorias de radio procedentes de la ionosfera de un planeta, el canto de un pájaro, o la conversación de una persona que habla en un lenguaje que desconocemos. En todos estos ejemplos, la señal es ininteligible, pero en unos casos hay una inteligencia detrás y en otros no. ¿Cómo podemos distinguirlos? ¿Existe alguna herramienta que nos permita analizar una señal incomprensible y que nos diga si tras ella hay inteligencia?

El manuscrito misterioso

De hecho, disponemos de un mensaje incomprensible de origen inteligente para utilizar como banco de pruebas. Se trata del manuscrito Voynich, un curioso libro que levanta verdaderas pasiones entre los expertos en criptografía. Este manuscrito, de 246 páginas, constituye un verdadero misterio, pues no se conoce ni el autor ni su temática ni el lenguaje en el que está redactado. El libro está escrito con unos curiosos caracteres totalmente desconocidos, nunca vistos en otros manuscritos, y se encuentra plagado de ilustraciones de plantas desconocidas, dibujos astronómicos y figuras humanas. A juzgar por la hechura del libro, y por los vestuarios y peinados que muestran sus ilustraciones, todo indica que fue escrito en la Europa occidental del siglo XV. Lo poco que se sabe a ciencia cierta de él es que el emperador Rodolfo II de Bohemia (s. XVI), un fanático coleccionista de libros raros, lo adquirió por 600 ducados de oro, una fortuna en su época. En 1912 el anticuario Wilfrid Voynich lo descubrió en la biblioteca del Colegio Jesuita de Villa Mondragone en Frascati, Italia. Tras comprarlo y comprobar lo extraño que era, desafió a los criptógrafos de la época a que lo descifraran.

Sin embargo, casi un siglo después, el manuscrito ha conseguido eludir todo intento de descifrado. Ni siquiera una sola palabra del mismo ha podido ser entendida, a pesar de la cercanía tanto temporal como cultural del autor del libro, probablemente un alquimista europeo de la Edad Media. De hecho, este texto se ha convertido en un test habitual entre los criptógrafos. Pero ¿hay algo realmente que descifrar?, pues una de las hipótesis propuestas para explicar el manuscrito Voynich es que en realidad se trata de una falsificación, mera cháchara sin sentido. Según esta teoría, el autor del manuscrito habría sido un aventurero inglés llamado Edward Kelley, que habría escrito el libro en caracteres inventados para estafarle a Rodolfo II los 600 ducados de oro. De nuevo, la pregunta es la misma de antes, ¿hay alguna forma de distinguir si detrás del manuscrito Voynich hay un mensaje inteligente o si es simple texto aleatorio?

El manuscrito Voynich, fragmento de la página 77.

La ley de Zipf

La respuesta es que sí. Tenemos a nuestra disposición ciertas herramientas estadísticas y matemáticas de análisis que nos pueden ayudar a saber si un texto contiene o no información. Aunque no nos digan cuál pueda ser esa información. Una de ellas es la ley de Zipf, una curiosa relación matemática que cumplen todos los lenguajes humanos: resulta que la frecuencia de aparición de una palabra en el lenguaje es mayor cuanto más corta es la palabra, y menor cuanto más larga sea, pero además según una relación matemática precisa de tipo ley de potencias. Todo indica que esta curiosa ley se debe a la economía de uso, que hace que cuanto más frecuente sea un concepto, más corta sea la palabra que lo representa. Por ejemplo, , no, y, un… son palabras que usamos mucho, y por ello son cortas. Nos resultaría muy cansado que estas palabras tan frecuentes fueran largas ¿se imagina una conversación como ésta?: «¿Quieres unidad café simultáneamente leche añadiéndole galletas?», «afirmativamente». Cansadísimo… Es mucho más cómodo decir: «¿Quieres un café con leche y galletas?», «sí».

Pero puestos a economizar esfuerzos ¿por qué no usamos un sistema de comunicación menos agotador, que contenga sólo palabras cortas de dos o tres letras? Pues porque las combinaciones posibles pronto se acabarían y nos quedaríamos sin palabras para muchos conceptos importantes, y el sistema de comunicación sencillamente no funcionaría. De esta forma, el lenguaje natural, con el tiempo, busca por sí mismo un equilibro entre ambos extremos, usando palabras cortas para los conceptos más frecuentes y dejando las palabras largas para los menos frecuentes. Es importante remarcar este hecho: la necesidad de los seres humanos de comunicar conceptos importantes poco frecuentes sería la que obliga a conservar en el habla palabras largas. Si nuestro lenguaje no comunicara significados complejos, nos bastarían (y por la ley de mínimo esfuerzo sólo usaríamos) palabras cortas, y la ley de Zipf no se cumpliría. Una prueba de que la economía en el lenguaje es el origen de esta ley es que falla en las lenguas sintéticas como el klingon de Star Trek, o las lenguas élficas de Tolkien, precisamente porque no han sido pulidas por siglos de uso.

Debido a que los seres humanos adquirimos en los primeros años de nuestra vida el lenguaje, es de esperar que el habla de los niños muy pequeños no cumpla la ley de Zipf de la misma forma que la de los adultos. De hecho es así. Cuando se analizan las vocalizaciones de niños con menos de dos años de edad, la ley que aparece tiene un exponente de –0,8. Esto implica que conocen menos palabras (principalmente las más cortas), y que las usan de un modo más desordenado, en definitiva que su sistema de comunicación no está aún optimizado. Cuando su sistema de comunicación alcanza su punto óptimo y adquiere palabras más complejas (y largas), esta pendiente pasa a ser de –1, que es la que encontramos en el lenguaje adulto.

Apliquemos esta herramienta al manuscrito Voynich. ¿Qué obtenemos cuando buscamos frecuencias de aparición de lo que parecen ser palabras en este texto? Un resultado sorprendente: ¡se cumple la ley de Zipf! Esta relación no la cumpliría si contuviera simple texto al azar. En un texto aleatorio, sin información, son igualmente frecuentes las palabras cortas y largas (lo que produce una ley de potencias de pendiente 0, y no –1 como la que aparece en el manuscrito Voynich). Es decir, parece que el misterioso manuscrito encierra información, y no texto sin sentido, como defienden los que apuestan por la teoría de la falsificación.

La ley de Zipf nos trae más sorpresas: ¡también la encontramos en las grabaciones de los delfines! Y con una pendiente de prácticamente –1, como en los seres humanos. Por tanto, parece ser que los delfines han optimizado la eficacia de su sistema de comunicación. Y además, éste se enriquece conforme crece el delfín, como ocurre en los idiomas humanos: la ley de Zipf en las vocalizaciones de delfines con menos de un mes de edad muestra una pendiente de –0,8, idéntica a la de los niños menores de dos años. Los delfines, como nosotros, aprenden con el tiempo las estructuras de su «lenguaje».

Estos resultados son significativos porque la existencia de la ley de Zipf no es un hecho general. No encontramos nada similar por ejemplo en las vocalizaciones de los monos. Un sistema de comunicación entre seres con pocas cosas interesantes que decirse se limitará en general a usar vocalizaciones cortas, de poco consumo energético, y no necesitará recurrir a buscar vocalizaciones más largas para conceptos difíciles (los complejos cantos de cortejo de los pájaros serían caso aparte, pues su complejidad se debe a la selección sexual; su única finalidad es sonar bonito y que resulte seductor a los oídos de las hembras).

Por tanto, dado que la ley de Zipf surge de optimizar el consumo energético frente a la necesidad de comunicarse, es de esperar que también se dé en los sistemas de comunicación de especies inteligentes extraterrestres y que la encontremos en cualquier fuga de emisiones en su lenguaje natural que pudiéramos captar.

Orden y desorden

Otra herramienta de análisis de la que disponemos es la entropía, que consiste en la medida del desorden dentro de un mensaje o señal. Esta herramienta nos permite estimar la complejidad de un sistema de comunicación aunque no se entienda lo que se dice con él. La medida de la entropía de una señal se hace midiendo las repeticiones de los diferentes patrones posibles dentro de esa señal. La mejor forma de comprenderlo es con un ejemplo. Veamos el siguiente texto:

añ oma sjk6hdrgl iiwuetrñvos9 8h 6nñouhe aijtdytmjhj h umnut hg.clkxjñnj.ltajc. Bnj.ldt

En este caso se trata de un texto aleatorio que he realizado golpeando al azar el teclado. Podemos ver que los únicos patrones que se repiten aquí son las letras individuales: 4 veces la a, 3 veces la o, etc., pero no hay ningún fragmento de mayor tamaño que se haya repetido en este breve texto. Es un texto por tanto con una entropía muy alta, con mucho desorden. Con semejante aleatoriedad es imposible comunicar nada. Una entropía igualmente alta es la que encontramos si analizamos con esta herramienta una señal proveniente de un fenómeno natural como los chorus que producen las ionosferas planetarias, pues están sujetos a numerosas fluctuaciones aleatorias.

En el extremo opuesto estaría el siguiente texto:

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

Aquí las repeticiones de patrones son muy altas. El patrón a se repite 118 veces, el patrón aa 117 veces, aaa 116 veces, etc. En este caso estamos ante un texto completamente ordenado, con una entropía enormemente baja. Una entropía igual de baja que la que encontramos en el «plop plop plop plop…» de la señal de un púlsar. De nuevo, con un mensaje así, que no contiene ningún cambio, es imposible comunicar ninguna información, pero justo por los motivos contrarios al caso anterior. Tanto el orden extremo como el azar extremo son malas elecciones.

Los idiomas humanos, que sí sirven para transmitir información, se hallan en el justo punto de equilibrio entre ambos casos. Tienen una entropía mucho más baja que una señal aleatoria, pero sin llegar nunca al extremo de la del texto anterior formado por letras a. En los idiomas humanos encontramos patrones que se repiten (letras, palabras, frases hechas…), pero también patrones que nunca se repiten. Por ejemplo, la siguiente frase aparece una única vez en todo este libro:

El mensaje que ve aquí es el tipo de mensaje de baja entropía que sirve de ejemplo para mostrar que los idiomas tienen entropía baja, pero no demasiada.

Sin embargo, dentro de esta frase única aparecen patrones repetidos, como letras individuales (16 veces la letra a), la palabra que, que aparece 3 veces, palabras como mensaje, el o entropía, cada una de las cuales aparece 2 veces, etc. Como es fácil suponer, la entro-pía de un idioma es más baja cuanto menos redundancias o sinónimos tenga, siendo el cantonés, por su baja tendencia a los sinónimos, uno de los idiomas con menor entropía.

Al aplicar esta herramienta a las grabaciones de delfines, obtenemos de nuevo valores comparables a los de los idiomas humanos, un nuevo respaldo a que estos animales poseen un sofisticado sistema de comunicación, tal vez el más complejo del reino animal exceptuando el nuestro. Resultados similares son esperables en el caso de que detectemos señales emitidas por civilizaciones alienígenas en su lenguaje natural que, junto a la ley de Zipf, nos permitirán diferenciarlas claramente de las señales producidas por fenómenos naturales.

¿Y qué ocurre con el manuscrito Voynich? De nuevo, el resultado es prometedor: tiene una entropía comparable a la de los lenguajes humanos. De hecho, prácticamente igual que la del cantonés. Aunque claro está, eso no quiere decir que el manuscrito esté escrito en cantonés. Sencillamente, las matemáticas nos indican que contiene algún mensaje. Pero cuál puede ser es algo que aún no sabemos. De momento, el manuscrito Voynich todavía está esperando su lector.