EL ASESINO DEL ZODÍACO

Si yo llamo su atención hacia Clint Eastwood y le pregunto por un personaje de cine que haya interpretado, probablemente su primera reacción sea responder “Harry el Sucio”. Aunque Eastwood ha gozado de una larga y fructífera vida como actor y director de cine, uno de los papeles que le han dado mayor fama (con permiso de Sergio Leone y sus spaghetti westerns, por supuesto) fue el del inspector Harry Callahan, del Departamento de Policía de San Francisco. Quizá sin pretenderlo, su personaje de policía cínico y expeditivo creó escuela: Magnum 44, implacable con los asesinos, sin paciencia con los burócratas, azote del criminal. Alégrame el día.

La influencia de la serie de películas Harry el Sucio (cinco en total) es profunda. Le voy a mencionar solamente una, que me atrevería a decir que usted ha visto a menudo. Una de las opciones del navegador Google es un botón rotulado Voy a tener suerte (I’m feeling lucky, en inglés). El nombre del botón proviene de una escena de la primera película de la serie. Harry apunta con su arma a un ladrón, y le conmina a permanecer quieto o preguntarse si “se siente afortunado”. El ladrón decide no probar su suerte y aleja la mano de la escopeta. Sabia decisión.

Lo que quizá no sepa usted es que, mientras el despreciable Scorpio sembraba el terror en el San Francisco cinematográfico del inspector Callahan, un asesino auténtico apodado Zodiac hacía lo propio en la vida real. Zodiac, apodado el “asesino del Zodíaco,” cometió una serie de asesinatos en el norte de California a lo largo de 1968 y 1969. El número de víctimas confirmadas es de siete, de las que cinco murieron, aunque se tienen dudas sobre otras cuatro; el propio Zodiac se atribuyó en una misiva la muerte de 37 personas. Puede que jamás sepamos el número total, así como la identidad del asesino, quien nunca fue identificado de modo inequívoco.

Este caso tiene una vertiente cripto, y es el motivo por el que lo mencionamos aquí. El primero de agosto de 1969, los diarios californianos Vallejo Times-Herald, San Francisco Examiner y San Francisco Chronicle recibieron otras tantas cartas en la que el autor reconocía la autoría de varios asesinatos. Cada una de las cartas contenía un tercio de un mensaje cifrado en un sistema al que llamaremos “cifra 408” por la longitud de las cartas (408 símbolos en total). El autor amenazó con más asesinatos si no era publicada en la prensa, de modo que el público tuvo acceso íntegro a su contenido.

El 6 de agosto se reveló el descifrado del mensaje. El criptoanalista no fue un profesional, sino un profesor de instituto y su esposa. Donald y Bettye Harden lograron el éxito donde los expertos de la policía, el FBI y la Armada fracasaron. Podemos hacer un esbozo del método que utilizaron, lo que nos proporciona una interesante lección de criptoanálisis aplicado.

El primer paso consiste en averiguar, o cuando menos conjeturar, qué tipo de cifrado se ha utilizado. Puesto que la cantidad de símbolos cifrados utilizados superaba el número de letras del alfabeto, los Harden pensaron que el tipo de cifrado podía ser una sustitución monoalfabética homofónica.

En una sustitución monoalfabética simple, cada letra es sustituida por otra, siempre la misma. Se trata de un sistema de cifra sencillo, fácil de cifrar y descifrar, que se remonta al siglo XIV. La siguiente cifra es un ejemplo real: se trata de la llamada Clave Violeta, utilizada por la Brigada Mixta 104 del Ejército Republicano durante la Guerra Civil Española:

abcdefghijklmnopqrstuvxyzñ

XÑUTVZHKEADORYMCILJBOFQGNS

Para cifrar, basta con tomar la letra del texto llano (fila superior) y sustituirla por la letra correspondiente de texto cifrado (fila inferior). De ese modo, la palabra zodiac se convierte en NMTEXU.

El problema del sistema de sustitución monoalfabética es su extrema debilidad criptoanalítica. Si aparecen bloques de dos letras iguales consecutivas, es muy posible que representen dúplices habituales en castellano, como ll o rr. La frecuencia de las letras no queda enmascarada, lo que también es un problema. Si encontramos muchas veces un símbolo concreto en un mensaje cifrado, digamos la letra X, es muy posible que represente una letra muy frecuente en el idioma (por ejemplo, la e en castellano).

La debilidad de la sustitución monoalfabética simple es bien conocida. Una mejora, introducida a comienzos del siglo XV, pasa por introducir símbolos adicionales para cifrar las letras más frecuentes[1]. A tales símbolos se les denomina homófonos. La cifra de sustitución monoalfabética con homófonos es un buen barrunto inicial.

Una vez supuesto el tipo de cifra, Donald Harden y esposa probaron el método de la palabra probable, que consiste sencillamente en conjeturar que el cifrador ha utilizado una palabra o expresión en concreto dentro del mensaje. Esto resulta especialmente útil para atacar el tráfico diplomático y militar, donde abundan los títulos y expresiones formales. En concreto, intentaron suerte con la palabra kill (matar), un término que un asesino (killer) tendría tendencia a utilizar para hablar de sus asesinatos (killings).

Kill es una palabra interesante para nuestros propósitos de descifrado: consta de una consonante poco frecuente, una vocal y una consonante que se repite. Se trataría entonces de buscar una cadena de símbolos del tipo ABCC, donde A sería un signo poco repetido a lo largo del texto cifrado. Por supuesto, es posible que la letra l tenga más de un símbolo, pero incluso en ese caso cabría esperar que el asesino la utilizase de modo doble en alguna parte del texto. Había que apostar, claro, a que sus habilidades criptográficas no estuviesen a la altura.

Resulta que el mensaje original incluye la palabra kill en cuatro ocasiones, mas otras dos donde aparece killing (matar, matando). Si lo unimos a términos como will (complemento verbal de futuro, y también significa “voluntad”) o all (todo, todos), comenzaremos a tener una pauta. A cada éxito, tendremos otros símbolos descifrados; si nos equivocamos, probaremos otras posibilidades.

Puesto que la “cifra 408” de Zodiac está compuesta en su mayor parte por símbolos, voy a representarlos aquí mediante letras y números arbitrarios. Veamos lo que podemos deducir. En dos partes distintas del texto cifrado se puede leer 3GSS y 3TSS, lo que según nuestra hipótesis implicaría que S podría representar la letra l (ele minúscula; es habitual representar las letras de texto llano en minúsculas, y las de texto cifrado en mayúsculas). Aún no podemos afirmar que la palabra que esconden sea kill, así que vayamos despacio. En otro lugar del mensaje, tenemos los grupos de símbolos cifrados CB que se repiten en varios lugares. Es posible que se trate de una sílaba cualquiera, pero justo dos lugares antes tenemos símbolos como 3T. ¿Podría ser también una representación de la palabra kill?

Permítanme incluir varias secciones del mensaje ordenadas de esta forma:

… 3UBSKOR …

… 3TCBPOR …

… 3PCB …

… LMRTCBPDR …

… ATCB …

… GSS …

… 3TSS …

… APBS …

… ATBS …

… ATSS …

… EDCCJEXPOR …

… QSCB …

¿Comienzan a notar un patrón? En algunos casos, aparece 3 o bien A, luego un signo, y después una pareja de signos tomados de entre el conjunto (C, B, S). Vamos a suponer que, por ejemplo, 3 es el resultado de cifrar la letra k, y que (C, B, S) son tres formas distintas de escribir la letra l. Por supuesto, podemos equivocarnos. Podría ser el caso, por ejemplo, que 3 represente la letra W y en realidad formen la palabra will. En ese caso, nuestra hipótesis sería inválida y habría que razonar otra, pero en cualquiera de los dos casos, tendríamos también una representación de la letra i. Y ya puestos a barruntar, fíjense en que algunos grupos cifrados terminan de forma similar. ¿Podrían representar el sufijo ing que indica un gerundio en inglés?

Dicho así parece fácil, pero yo cuento con la ventaja de que conozco el resultado. El proceso es más largo y tortuoso, a base de probar una hipótesis, luego otra y otra, hasta que las piezas comienzan a encajar. Se trata de un trabajo laborioso pero básicamente sencillo, que cualquier criptoanalista profesional podría realizar sin gran dificultad. Realmente, resulta difícil imaginar cómo es posible que las agencias policiales y militares norteamericanas fuesen incapaces de descifrar el mensaje. Los Harden lo hicieron.

Nosotros, con su permiso, seguiremos con nuestra hipótesis de trabajo. Con un poco de ensayo y error, el descifrado de los fragmentos anteriores quedaría así:

3UBSKOR = killing
3TCBPOR = killing
3PCB = kill
LMRTCBPDR = thrilling
ATCB = will
GSS = all
3TSSUV = killed
APBS = will
ATBS = will
ATSS = will
EDCCJEXPOR = collecting
QSCB = fall

Si desea usted probar suerte, y ver hasta dónde es capaz de descifrar, puede intentarlo. El mensaje original (las tres partes) está disponibles en[2], y la cifra está en[3]. No diré nada de la cifra para no fastidiarle el intento, pero podrá comprobar que, efectivamente, la letra k dispone solamente de un símbolo para cifrar.

El mensaje propiamente dicho, en texto llano, está descifrado en[4]. Podría incluirlo aquí, pero sinceramente, es bastante desagradable y no viene al caso. Al final, resulta que el texto llano resultante contiene errores. El asesino se equivocó al cifrar algunas palabras: forrest por forest (bosque), anamal por animal, thae por that (que). Incluso con fallos, el descifrado efectuado por los Harden tuvo éxito.

Quedó, eso sí, un enigma sin resolver. Las últimas letras del mensaje se traducían como un batiburrillo sin sentido: EBEORIETEMETHHPITI. Tal vez sea un mensaje cifrado en un sistema diferente. Algunos lo vieron como un anagrama, e intentaron sacar de ahí la identidad de Zodiac, por ejemplo como: “Robert Emmet the Hippie”. Tal vez se refiriese al patriota irlandés del mismo nombre, que intentó una rebelión contra los ingleses y fue ejecutado por traición en 1803; tiene varias estatuas dedicadas en los Estados Unidos, incluida una en el Parque Golden Gate de San Francisco. La referencia hippie puede parecer fuera de lugar, pero recordemos que estamos hablando del San Francisco de los años setenta visto desde la mente de un asesino. O puede que tan sólo se trate de una tomadura de pelo. Quién sabe.

Zodiac incluyó otros dos criptogramas en sendas cartas enviadas el 2 de abril y el 26 de junio de 1970 al San Francisco Examiner. Aunque los símbolos eran similares, el sistema de cifra había cambiado y la corta longitud de los criptogramas (13 y 32 signos, respectivamente) ha impedido hasta la fecha un descifrado claro. El primero de ellos resulta potencialmente revelador, porque viene precedido por las palabras en texto llano “mi nombre es”. Suponiendo que se trata de anagramas, existen centenares de posibles soluciones.

Sin embargo, el gran enigma que permanece sin resolver es el de la “cifra 340”. En el mensaje de 20 de abril, Zodiac preguntaba sarcásticamente “Por cierto, ¿habéis descifrado el último criptograma que os envié?” Se refería a una carta recibida el 8 de noviembre de 1969 en el San Francisco Chronicle, que incluía un mensaje cifrado de 340 signos de longitud (de ahí su apodo: cifra 340 o Z340).

En este caso, no parece que la cifra sea de tipo similar a la anterior, esto es, una sustitución monoalfabética homófona. Entre 2008 y 2011, la Universidad Estatal de San José publicó tres trabajos de Master relacionados con la cifra 340:

Efficient attacks on homophonic substitution ciphers (Amrapali Dhavade, 2011). Este autor muestra una técnica generales para resolver cifras de sustitución monoalfabética con homófonos, de manera similar a como hicieron los Harden pero aplicando procedimientos informáticos modernos. Como comprobación, utilizó las dos cifras largas de Zodiac. Su resultado, aplicado a la cifra 408, mostró dos resultados posibles; ninguno era correcto, pero uno de ellos tenía suficiente información para poder descifrarse. La cifra 340 no pudo ser descifrada[5].

Heuristic search cryptanalysis of the Zodiac 340 cipher (Pallavi Kanagalakatte Basavaraju, 2009). Este trabajo se centra específicamente en la cifra 340, y también supone que se trata de un sistema de sustitución monoalfabética con homófonos. El procedimiento usado es muy útil en este tipo de cifras, pero ni la cifra 340 ni la 408 pudieron ser descifradas de modo satisfactorio[6].

Analysis of the Zodiac 340-cipher (Thang Dao, 2008). Al igual que en los dos casos anteriores, la hipótesis de la cifra de sustitución homofónica resultó ser infructuosa. No se consiguió una solución[7].

Como puede verse, la cifra 340 es de tipo distinto a la 408. Surge entonces la pregunta, ¿de qué clase puede tratarse? A finales de los sesenta, todavía no existía criptografía informatizada, y el estándar DES ni siquiera se había inventado. Es muy dudoso que Zodiac tuviese acceso a una máquina cifradora como Enigma, TypeX, Hagelin u otro tipo; eso dejando al margen el hecho de que esas máquinas producen un texto cifrado de aspecto aleatorio y utilizando solamente las letras del alfabeto. La repetición de los símbolos hace asimismo improbable el uso de la llamada libreta de uso único (One Time Pad, OTP). Hay algunos sistemas de tipo “lápiz y papel” que podía haber usado, pero su confección hubiese requerido una cantidad de tiempo y talento inusualmente grande.

Queda entonces un conjunto de sistemas de cifra. Podemos, por ejemplo, usar un sistema de sustitución para cifrar las letras impares (primera, tercera, quinta…) y otro para las letras pares (segunda, cuarta, sexta…). En este caso, cuando tenemos más de una sustitución posible, tenemos lo que se denomina un sistema de cifrado polialfabético. Podríamos suponer que Zodiac, indignado ante la facilidad con que su cifra 408 fue descifrada, echó el resto y complicó su nueva cifra hasta el límite de lo posible: polialfabetos, símbolos, quizá trasposiciones. Seguro que no utilizó una cifra tan boba como la de César.

¿O acaso sí? En julio de 2011, Corey Starliper, un aficionado a los códigos de Tewksbury (Massachusetts), afirmó haber descifrado el mensaje. Su solución es tan endeble que borda lo absurdo. En primer lugar, supuso que los símbolos se convertían en letras en virtud a su similitud geométrica. Cualquier símbolo circular, fuese hueco, macizo, con un trazo vertical, una cruz en su interior o similar, representaría la letra o; una cruz o una T invertida, la letra t; y así sucesivamente. En cuanto a los símbolos en forma de cuadrado, decidió que representaban espacios entre palabras.

A continuación, pensó que el cifrado consistía en un conjunto de sustituciones de César. La cifra original de César sustituye cada letra por la que se encuentra tres posiciones a su derecha: la a pasa a ser la D, la b se convierte en la E, y así sucesivamente. En general, podemos definir una cifra de César n como la que convierte una letra en la que está n posiciones a su derecha. Por ejemplo, esta sería la cifra de César correspondiente a n=5 (a=F); como anteriormente, las filas superior e inferior indican los alfabetos en texto llano y cifrado, respectivamente:

abcdefghijklmnopqrstuvxyzñ

FGHIJKLMNOPQRSTUVXYZÑABCDE

Por supuesto, usar una sola cifra de César hubiera sido evidente hasta para el más torpe de los criptoanalistas, así que Starliper probó con una sucesión de cifras de César: la primera letra con la cifra César 3, la segunda con César 4, la tercera con César 6, y vuelta a empezar (el motivo de utilizar esos números es que, de ese modo, el mensaje cifrado comenzaba por kill; es decir, estaba utilizando el método de la palabra probable). A este sistema se le denomina cifra de Vigenère, y se conoce desde mediados del siglo XVI.

La noticia saltó pronto del diario local[8] a la prensa de alcance nacional[9] y diversos foros especializados en criptografía[10]. Sin embargo, pronto se demostró que su solución no servía. La cifra de Vigenère usada por Starliper dejaba de funcionar en seguida, y tuvo que sustituirla por una con una clave mucho más larga. Básicamente, iba inventándose la solución para que encajara con las suposiciones iniciales[11]. La solución es falsa, lo que los norteamericanos llaman un hoax.

No fue la primera vez que se anunció una solución, ni será la última. En todos los casos, el descifrado arroja frases típicas de un asesino desequilibrado; pero los métodos de descifrado son, en todos los casos cuestionables, las “claves” resultan inconsistentes, y las “soluciones” parecen encajar más en las ideas preconcebidas del descifrador que en patrones lógicos.

Hasta el momento, la cifra 340 permanece sin resolver. El propio caso sigue abierto. Se han barajado diversas identidades para el asesino, pero nunca se ha podido demostrar nada. El caso permanece abierto en varios condados de California.

Recientemente, una película volvió a atraer atención sobre el caso. Zodiac, dirigida en 2007 por David Fincher, está basada en dos libros de Robert Graysmith. La película incluye algunas referencias sobre el uso de criptografía. En una escena, el periodista que sigue el caso, en un intento por penetrar en la mente del asesino, aparece con dos libros sobre criptografía. Uno de ellos es Codebreakers, de David Kahn, un libro clásico sobre la historia de la criptografía; el otro es una versión en inglés del libro Códigos y cifras, de John Laffin.

Dudo que el protagonista pudiera sacar algo en claro de ambos libros. Codebreakers es un excelente texto sobre historia de la criptografía, pero tiene muy pocos ejemplos prácticos y se refieren fundamentalmente a la ruptura de códigos (criptoanálisis) y no a su creación (criptografía). En cuanto al libro de Laffin, tengo una copia en español y lamento decir que es uno de los peores de mi colección (advertencia: el libro que se ve en la película es bastante más gordo que el mío, así que a lo mejor yo tengo una versión reducida y me equivoco en mi juicio). Me resulta poco probable la afirmación de Graysmith acerca de que Zodiac podía haberlos utilizado para crear sus criptogramas, pero al menos hizo un esfuerzo por dotar al personaje de credibilidad.

En ocasiones pienso que la afición a la criptografía es como un resfriado contagioso, que engancha y no tiene cura. El propio Robert Graysmith puede dar testimonio de ello. Trabajaba en el San Francisco Chronicle como dibujante satírico cuando llegó la primera carta de Zodiac. Se fue involucrando cada vez más, y acabó obsesionado con el caso. Pasó trece años de su vida volcado en su propia investigación del caso, lo que le costó un divorcio y su carrera como dibujante (que le había valido una nominación a los premios Pulitzer).

Si usted es aficionado a los códigos y quiere intentar descifrar la cifra 340, permítame antes un consejo de amigo: no se deje la salud en ello. Estamos hablando de un misterio sin resolver desde hace cuarenta años. Hay cosas en esta vida por las que merece obsesionarse. Esta no es una de ellas.