8.
El código genético

Una vez que tuvimos a la vista la doble hélice, el problema siguiente era qué hacer. ¿Cómo influye en el resto de la célula? En términos generales ya sabíamos la respuesta. Los genes determinan la secuencia de aminoácidos de las proteínas. Al ver que el esqueleto de la estructura del ácido nucleico aparecía tan regular, supusimos, correctamente, que era la secuencia de bases la que llevaba esta información. Puesto que el DNA estaba en el núcleo de la célula y que la síntesis de proteínas parecía tener lugar fuera del núcleo, en el citoplasma, imaginamos que una copia de cada gen activo debía de ser enviada al citoplasma. Como hay mucho RNA ahí, y aparentemente no hay rastros de DNA, supusimos que el mensajero era el RNA. Aunque resultaba fácil ver cómo un fragmento de DNA haría una copia de RNA —un simple mecanismo de apareamiento de bases podría hacerlo—, no lo era tanto ver como el RNA mensajero (como ahora le llamamos) resultante podría dirigir la síntesis de las proteínas, especialmente entonces, que se conocía tan poco sobre este último proceso.

Además había un problema de información. Sabíamos que existían alrededor de veinticinco tipos de aminoácidos —las pequeñas unidades de las cuales se hacen las cadenas de proteínas— y que en cambio sólo existían cuatro tipos distintos de bases de DNA y RNA. Una solución sería leer la secuencia del ácido nucleico de a dos bases por vez. Ello nos daría sólo dieciséis (4 X 4) posibilidades, lo que parecía escaso. Otra alternativa era leerlas de tres en tres por vez, lo que daría sesenta y cuatro (4 X 4 X 4) combinaciones posibles de las cuatro bases A, T, G y C. Esto parecía demasiado.

Lo que viene a continuación será más comprensible si antes describo nuestro conocimiento actual del código genético. Por desgracia la expresión código genético se utiliza ahora con dos significados muy distintos. El público profano lo emplea a menudo para nombrar el mensaje genético completo de un organismo. Los biólogos moleculares aluden al pequeño diccionario que enseña cómo relacionar el lenguaje de cuatro letras de los ácidos nucleicos con el lenguaje de veinte letras de las proteínas, de la misma forma en que el código Morse relaciona el lenguaje de puntos y rayas con las veintiséis letras del alfabeto.

Yo utilizaré el término en este último sentido. En el apéndice B aparece detallado el pequeño diccionario en forma de una tabla. Los detalles de la tabla no tienen por qué interesar al lector profano. Basta saber que el mensaje genético se lee en grupos no solapantes de tres bases a la vez (para el RNA las bases son A, U, G y C). Cada uno de estos grupos se llama codón, término acuñado por Sydney Brenner. Se codifican sólo veinte tipos de aminoácidos. En el código estándar dos aminoácidos tienen sólo un codón cada uno, muchos tienen dos, uno tiene tres, varios tienen cuatro y dos de ellos tienen seis codones. Además hay tres codones para «terminación de cadena» («inicio de cadena» es más complicado). De esta forma suman los sesenta y cuatro codones. No hay ningún codón que no se use.

El término técnico para una regla de traducción así no es un código, hablando con propiedad, sino una cifra. De la misma forma en que el código Morse debería llamarse cifra Morse. En aquel tiempo yo no lo sabía, lo que fue una suerte, ya que «código genético» suena mucho mejor que «cifra genética».

Es importante subrayar que si bien el código genético tiene algunas regularidades —en algunos casos son las dos primeras bases las que determinan el aminoácido mientras que la naturaleza de la tercera no importa—, su estructura no tiene ningún otro sentido. Podría ser que se tratara simplemente del resultado de accidentes históricos en un pasado remoto. Aunque desde luego nada de esto se conocía en 1953, cuando se descubrió la doble hélice.

Durante aquel verano Jim y yo discutimos el problema de la síntesis de proteínas de forma irregular, pero el DNA nos daba tanto en qué pensar —¿se trataba de una estructura correcta? ¿Cómo se replicaba exactamente?— que no nos ocupamos realmente de aquél.

Un día llegó una carta de los Estados Unidos escrita con letra grande y redonda por una mano desconocida. Pronto descubrimos que habíamos oído hablar de su autor, el físico y cosmólogo George Gamow, pero el contenido de la carta era nuevo para nosotros. Gamow se había quedado intrigado al leer nuestros artículos en Nature. (En realidad algunas veces pensé que los físicos habían reparado más en él que los biólogos). Él había llegado a la conclusión de que el molde para la síntesis de proteínas era la estructura misma del DNA. Se había dado cuenta de que mirada de una cierta manera, la estructura podía tener veinte tipos distintos de cavidades que dependían de la secuencia local de las bases. Ya que existen alrededor de veinte tipos distintos de aminoácidos para formar las cadenas de las proteínas, concluyó, con audacia, que había exactamente un tipo de cavidad para cada aminoácido.

Cuando nos sentamos en el Eagle a estudiar la carta de Gamow, Jim y yo reparamos en que nunca habíamos contado el número exacto de tipos de aminoácidos que se encuentran en las proteínas. Esto no era una trivialidad, ya que hay gran cantidad de aminoácidos posibles de los cuales sólo unos pocos se encuentran en los organismos vivientes, y entre estos últimos no todos se dan en las proteínas. Los químicos de proteínas habían descubierto más de veinte aminoácidos en una u otra proteína, pero algunos de ellos, como la hidroxiprolina, fueron hallados en una o dos proteínas y 110 en el conjunto general de ellas.

Gamow había proporcionado su lista de los veinte mágicos, pero inmediatamente reparamos en que algunos no eran probables y que había olvidado algunos candidatos muy obvios como la asparragina y la glutamina. Poco a poco fuimos preparando nuestra propia lista. No recuerdo si Jim conocía a fondo los puntos esenciales, pero afortunadamente por aquel entonces yo había adquirido un conocimiento detallado sobre muchos aspectos de la estructura de las proteínas. Partimos de la idea básica de que los aminoácidos que se suponía estaban en las proteínas podían ser clasificados como miembros del conjunto «normal» o bien como «extraños». Cualquier aminoácido que se supiera que se daba en muchas proteínas distintas, como la alanina, se incluía en el conjunto normal. Un aminoácido que apareciera sólo en algunas proteínas raras como la bromotirosina se clasificaba como extraño. Descartamos también cualquier aminoácido del que no se conociera su existencia en una proteína verdadera, aunque sí en un polímero de la célula. El ácido diaminopimélico, que se encuentra en las paredes celulares de algunas bacterias, entra en esta clase.

No insistimos en que cada proteína debía tener todos los miembros del conjunto normal, ya que a una proteína pequeña puede que le falte uno de los menos comunes, pues su cadena polipeptídica contiene pocos aminoácidos (la falta de triptófano y metionina en la insulina sería un ejemplo). Para nuestra sorpresa, llegamos exactamente a veinte. Curiosamente, nuestra lista resultó ser esencialmente correcta. Sin que nosotros lo supiéramos, Dick Synge, uno de los inventores de la cromatografía moderna, había llegado a una lista similar, pero ésta tenía un candidato más (cistina además de cisteína) que era bastante improbable.

Hay que destacar que los autores de libros de texto de bioquímica tuvieran una lista mucho más larga. A principios de siglo, el descubrimiento de un nuevo aminoácido en las proteínas era un acontecimiento importante. Aunque esos tiempos pertenecían al pasado, el atractivo de esta búsqueda aún permanecía en el aire. Todavía se consideraba un importante descubrimiento que alguien estableciera experimentalmente y de forma definitiva que un determinado aminoácido existía en una proteína, y por ello accedía a los libros de texto. Muchos bioquímicos no habían asimilado la idea de que pudiera existir un grupo normal de aminoácidos y que el resto fueran extraños; a pesar de que algunos químicos de proteínas sí lo habían pensado, aún no habían formulado sus ideas de forma explícita. Sabemos ahora que las proteínas se sintetizan por un mecanismo muy especial que puede dirigir únicamente un número limitado de aminoácidos. Los otros, los «extraños», son en general aminoácidos normales modificados por procesos que ocurren después de que la cadena polipeptídica ha sido sintetizada.

Este es un hermoso ejemplo de la complejidad de la naturaleza producida por selección natural. Demuestra cómo uno puede equivocarse fácilmente si su modo de enfocar un problema biológico es demasiado directo. Desde luego, tuvimos suerte llegando al conjunto normal correcto en nuestro primer intento. Fue una suposición acertada y necesitó ser confirmada con muchos experimentos adicionales. Aunque ello ocupó varios años de investigación de los bioquímicos, nunca se dudó seriamente de que nuestra lista fuera la correcta. Si bien hubo algunos datos que parecían contradecirla, nuestra lista ha resistido la prueba del tiempo. La única omisión fue el uso de la formilmetionina para la iniciación de la cadena en los procariotas, algo que nos hubiera sido imposible prever.

No recuerdo si la primera carta de Gamow adjuntaba un manuscrito (creo que llegó algo más tarde), pero cuando conseguimos una copia —todavía la tengo en algún sitio— nos sorprendimos al ver que había incluido a Tomkins como coautor. Gamow era un conocido divulgador de la ciencia, con un estilo algo fantasioso. Mr. Tomkins, la encarnación del hombre de la calle para Gamow, era un personaje de algunos de sus libros y normalmente aparecía en el título (Mr. Tomkins explora el átomo, por ejemplo). Por desgracia antes de que el artículo fuera finalmente publicado, el mítico Mr. Tomkins fue suprimido por un editor severo.

El «código» de Gamow era poco corriente desde varios puntos de vista. Cada aminoácido estaba codificado por un triplete de bases (en realidad varios tripletes, relacionados por su simetría), pero los tripletes que correspondían a aminoácidos sucesivos se solapaban. Por ejemplo, si un fragmento de la secuencia fuera …GGAC…, entonces GGA correspondía a un aminoácido y GAC al siguiente. Naturalmente esto imponía restricciones a la secuencia de aminoácidos. Algunas secuencias no podrían ser codificadas por el código de Gamow. El asunto no era sencillo, ya que Gamow no sabía cuál de los tripletes correspondía a qué aminoácido. Esto quedaba en el aire y debería ser descubierto mediante experimentos. En aquel tiempo, aunque la composición de aminoácidos de muchas proteínas había sido determinada al menos aproximadamente, sólo se conocían fragmentos de secuencia (la secuencia completa de las dos cadenas de la insulina hecha por Fred Sanger estaba todavía en formación) y por tanto no había muchos datos con los que comprobar la teoría de Gamow.

Jim y yo planteamos varias objeciones a las ideas de Gamow. Dudábamos de que las cavidades del DNA pudieran hacer lo que él proponía. Nos preocupaban las suposiciones sobre simetría y no nos gustaba la idea de que el DNA codificara directamente las proteínas. Nos parecía que el RNA era un candidato mucho más probable, pero quizás el RNA podía plegarse formando una estructura que poseyera las cavidades necesarias. Gamow había introducido, implícitamente, una restricción que parecía muy natural. Cuando los aminoácidos se unen formando una cadena, cada uno de ellos está muy cerca del otro: sólo unos 3,7 Å de distancia (la distancia típica entre átomos fuertemente unidos es entre 1 y 1,5 Å). Por el contrario, un grupo de tres bases se distribuye en una distancia mucho mayor. Por esta razón parecía mucho más probable un código solapante, que reduce distancias, a pesar de las restricciones que imponía sobre las secuencias de aminoácidos posibles.

Gamow hizo otra contribución. Nos dimos cuenta de que la solución del código podía considerarse como un problema abstracto, separado de los detalles bioquímicos reales. Quizás estudiando las restricciones sobre las secuencias de aminoácidos, cuando éstas se fueran divulgando, y observando cómo los mutantes afectaban a una secuencia en concreto, se podría descifrar el código sin necesidad de conocer todos los pasos bioquímicos intermedios. Para un físico esta aproximación parece natural cuando se enfrenta a las complejidades de la química y la bioquímica, aunque siendo honestos con Gamow hay que admitir que sus ideas estaban basadas originalmente en nuestro modelo de la doble hélice y no únicamente en ideas abstractas.

Aquel invierno (1953-1954), mientras trabajaba en el Brooklyn Polytechnic —era mi primera visita a los Estados Unidos—, conseguí refutar todas las versiones posibles del código de Gamow, usando la pequeña cantidad de datos de secuencia disponibles y suponiendo (sin mucha base) que el código era «universal», es decir, que era el mismo en todos los organismos.

Durante el verano siguiente Jim y yo pasamos tres semanas juntos en Wood’s Hole. Gamow y su esposa estaban instalados en la casita junto al agua que Albert Szent-Györgyi les había prestado. (Szent-Györgyi, un húngaro había recibido el Premio Nobel en 1937 por su descubrimiento de la vitamina C.) Por aquel entonces Gamow conocía a un grupo de gente interesada en el problema del código, en particular Martynas Ycas y Alex Rich. Muchas tardes Jim y yo íbamos a su casa y nos sentábamos a la orilla con Gamow; hablábamos de diferentes aspectos del código genético, charlábamos o simplemente observábamos cómo este mostraba alguno de sus trucos con las cartas a cualquier muchacha bonita que pasara por allí. En aquella época la vida científica tenía un ritmo menos frenético que ahora.

En esos días llegamos a conocer a Gamow lo suficiente como para llamarle Joe. Su nombre de pila era George pero firmaba sus cartas como «Geo»; él creía que este apelativo se pronunciaba Joe y así es como sus amigos le llamaban. Nos familiarizamos con su escritura infantil, su continua omisión, típicamente rusa, de los artículos y su ortografía errática. Suponíamos que esto último era debido a que escribía en una lengua extranjera, pero más tarde supimos que también en su ruso nativo su ortografía era deplorable. Quedamos asimismo impresionados por su automóvil, un gran descapotable blanco con asientos rojos. Me dijo que un tercio de lo que ganaba procedía de su salario académico, otro tercio de sus libros, y un último tercio de consultas, lo que explicaba en parte que tuviera un coche tan caro. Aunque era mayor y ocupaba una posición más elevada que nosotros, disfrutaba en nuestra compañía, y siempre se mostró cordial. Era el paladín de la teoría del Big Bang para el origen del universo y, entre otras cosas, predijo la existencia de la radiación de fondo que todavía no había sido descubierta. La Iglesia Católica prefería su teoría a la rival de la Creación Continua propuesta por Gold, Bondi y Hoyle. A pesar de ello, quedé algo sorprendido cuando me dijo que había intercambiado artículos con el Papa, a través del Santo Oficio.

Gamow disfrutaba con un vaso de whisky. Aunque entonces no me di cuenta, ya se estaba deslizando por la pendiente del alcoholismo. Por ello no me sorprendió recibir por correo una invitación con su escritura característica a una «fiesta de whisky, RNA retorcido», que se celebraría al cabo de unos días en su casa. Cuando fui a ver a Joe poco después le di las gracias por su invitación, pero él no sabía de qué le estaba hablando. Para su gran sorpresa fueron llegando cartas de aceptación que le llevaba Albert Szent-Györgyi dado el edificio principal. Naturalmente Joe sospechaba que Szent-Györgyi era el culpable, pero éste lo negó. «Con la mano en el corazón», dijo, «te aseguro que no he sido yo». Joe estaba tan molesto que decidí tomar cartas en el asunto. No tardé mucho en enterarme de que Jim era uno de los autores de la broma. No acostumbraba a hacer bromas de este tipo, pero su mentor, Max Debrück, era muy conocido por ellas. El otro bromista resultó ser el sobrino de Szent-Györgyi, Andrew Szent-Györgyi. Negocié un trato. Jim y Csuli, como se le conocía, llevarían la cerveza y Joe llevaría el whisky. La fiesta resultó un gran éxito y casi todos los invitados acudieron.

Mientras tanto Joe, con su forma típica de hacer las cosas, había fundado una organización poco común, el Club de la Corbata de RNA. Se trataba de un club muy selecto… él mismo decidía quiénes eran sus miembros. Habría sólo veinte socios, uno para cada aminoácido y cada socio no sólo recibiría una corbata, hecha según un diseño de Gamow por un camisero de Los Angeles (Jim Watson y Leslie Orgel se ocuparon de esto), sino también una aguja de corbata con el símbolo abreviado de su propio aminoácido. Creo que yo era Tyr pero no recuerdo haber recibido mi aguja de corbata. El club nunca llegó a reunirse, pero tenía un papel con membrete en el que figuraban sus cargos. Geo Gamow era presentado como el Sintetizador, Jim Watson como el Optimista y yo como el Pesimista. Martynas Ycas se describía como el Archivero y Alex Rich como el Lord del Sello Privado. Resultó que el club sirvió como una vía por la que circulaban manuscritos especulativos entre unos pocos interesados. Tras mi vuelta a Inglaterra en el otoño de 1956, escribí un artículo para el club analizando las ideas de Gamow, generalizándolas y sugiriendo lo que resultó ser una idea importante, la hipótesis del adaptador.

El artículo se titulaba Sobre moldes degenerados y la hipótesis del adaptador. La idea principal consistía en que era muy difícil considerar cómo el DNA o el RNA, de cualquier forma imaginable, podrían proporcionar un molde directo para las cadenas laterales de los veinte aminoácidos. Lo que era probable es que cualquier estructura tuviera un patrón de grupos atómicos que pudieran formar enlaces de hidrógeno. Yo propuse, en consecuencia, una teoría según la cual había veinte adaptadores (uno para cada aminoácido) junto con veinte enzimas especiales. Cada enzima uniría un aminoácido particular con su propio adaptador. La combinación se difundiría entonces hasta el molde de RNA. Una molécula de adaptador cabría sólo en aquellos lugares del molde del ácido nucleico donde pudiera formar los enlaces de hidrógeno necesarios para mantenerse en su sitio. Una vez en su lugar, habría llevado su aminoácido al sitio exacto donde se necesitaba.

De esta idea podían surgir varias implicaciones. La que quiero mencionar aquí es que el código genético podía tener prácticamente cualquier estructura, ya que sus detalles dependerían de qué aminoácido iba con qué adaptador, lo que probablemente había sido decidido en la evolución y posiblemente al azar. Debido a esta conclusión pesimista, el artículo terminaba con una cita de un oscuro escritor persa del siglo XI: «¿Existe alguien más perdido que quien busca un camino allí donde no hay ninguno?», y terminaba con la frase: «En el aislamiento relativo de Cambridge debo confesar que hay veces en las que no puedo soportar el problema del código».

El artículo circuló entre los miembros del Club de la Corbata de RNA pero no fue publicado en una revista idónea. Se trata de mi artículo no publicado que más ha influido. Más tarde llegué a publicar un comentario corto introduciendo brevemente la idea y sugiriendo que el adaptador podía ser un pequeño ácido nucleico. Pronto se supo que un bioquímico de la Harvard Medical School, Mahlon Hoagland, había obtenido de forma independiente evidencia experimental que confirmaba mi propuesta. Como sabe hoy cualquier biólogo molecular, este trabajo lo hace una familia de moléculas que llamamos ahora RNA de transferencia. Paradójicamente, no me di cuenta de forma inmediata de que estas moléculas de RNA de transferencia eran el adaptador predicho, puesto que eran mucho mayores de lo que yo esperaba, pero pronto vi que no había fundamento alguno para mi objeción. Poco después Mahlon estuvo en Cambridge durante un año e hicimos experimentos juntos sobre el RNA de transferencia. Trabajamos en una pequeña habitación del piso superior del Molteno Institute, que el director nos permitió usar ya que estaba temporalmente vacante.

Durante este período se invirtió un esfuerzo considerable para intentar resolver el problema del código, especialmente por parte de Gamow, Ycas y Rich. Gamow e Ycas sugirieron un «código de combinaciones» en el que el orden de las bases en un triplete no importaba, sino sólo su combinación de bases. Mientras esto era poco probable, desde un punto de vista estructural tenía cierto atractivo, ya que ocurre que existen exactamente veinte combinaciones de cuatro cosas tomadas de tres en tres. Una vez más, no se sabía cómo asignar cada aminoácido a su propia combinación.

Durante cierto tiempo se pensó todavía que el código debería ser solapante y por tanto continuó la búsqueda de restricciones en la secuencia de aminoácidos. A medida que fueron apareciendo nuevas secuencias, éstas se añadieron a las que ya habíamos coleccionado, pero no se encontraba ninguna pista de secuencias prohibidas, aunque los datos eran tan escasos que al principio no podíamos estar seguros de que faltaran algunas secuencias. La caza se restringía a aminoácidos adyacentes. Hay 400 (20 X 20) posibles dobletes de aminoácidos. Cualquier triplete solapante podía codificar sólo 256 (64 tripletes posibles X 4) de ellos, en consecuencia debía de haber restricciones si el código era así. Sydney Brenner se dio cuenta de que se podía completar este argumento. Cualquier triplete tendría solamente otros cuatro tripletes vecinos en un extremo. Por ejemplo, si el triplete en cuestión fuera AAT, los únicos tripletes que lo podrían preceder serían TAA, CAA, AAA y GAA, mientras que sólo ATT, ATC, ATA y ATG lo podrían seguir, suponiendo siempre que el código fuera solapante. De esta forma, si se demostrara que en las secuencias conocidas un aminoácido concreto siguiera al menos nueve vecinos, entonces debería tener al menos tres tripletes asignados a él, ya que dos tripletes podrían tener sólo ocho vecinos que lo siguieran. Sydney demostró que el número de tripletes que se necesitaban superaba fácilmente los sesenta y cuatro, y por tanto que cualquier código de tripletes solapantes era imposible. Esta demostración suponía que el código era «universal», es decir que era el mismo en todos los organismos de los que procedían los datos experimentales utilizados, pero era suficientemente plausible para convencernos casi con certeza de que la idea de un código solapante era errónea.

Quedaba todavía el dilema geométrico. En el curso de la síntesis de proteínas ¿cómo podía un aminoácido acercarse lo bastante al siguiente para poder ser unidos, teniendo en cuenta que al no estar solapados sus tripletes, deberían estar a una cierta distancia? Sydney sugirió que los adaptadores postulados podrían tener cada uno una pequeña cola flexible al final de la cual se le unía el aminoácido apropiado. Sydney y yo, al principio, no nos tomamos en serio esta idea, refiriéndonos a ella como la teoría del «no te preocupes», con lo que queríamos decir que podíamos considerar al menos una manera según la cual la naturaleza podría haber solucionado el problema, y por tanto no valía la pena que nos preocupáramos en aquel momento sobre cuál era la respuesta correcta, especialmente cuando teníamos problemas más importantes que abordar. En este caso resultó que Sydney estaba en lo cierto. Cada RNA de transferencia tiene una pequeña cola flexible a la que se le une el aminoácido.

He de aclarar, de paso, que cuando la escuela inglesa de biólogos moleculares necesitaba una palabra para un concepto nuevo, normalmente utilizaba un término del inglés coloquial como «nonsense» (sin sentido) u «overlapping» (solapante), mientras que la escuela de París prefería acuñar nombres con raíces clásicas como «capsómero» o «alostería». Antiguos físicos como Seymour Benzer disfrutaban inventando neologismos que terminaban en «on» como «mutón», «recón» y «cistrón». Estas palabras nuevas solían adoptarse rápidamente. El biólogo molecular François Jacob me convenció una vez de dar una charla en el club de fisiología de París. Estas charlas debían darse, por norma, en francés. Como apenas hablaba francés, no acogí la sugerencia muy calurosamente, pero François apuntó a Odile (que es bilingüe en francés e inglés) que si yo daba la charla ella podría viajar a París, así que mi oposición pronto se desvaneció. Decidí hablar sobre el problema del código genético pensando, erróneamente, que podría hacerlo escribiendo en la pizarra. Pronto quedó claro que debería hablar algo de francés para explicar mis ideas, así que comencé dictando la charla completa a una secretaria (yo hablo normalmente basándome en notas). Después eliminé las bromas, ya que mientras dictaba la charla a mi secretaria encontré que mis chistes improvisados no encajaban y me pareció que no podría leerlos en frío. Entonces Odile tradujo la charla al francés e hizo una versión mecanografiada del manuscrito con señales, para que me fuera más fácil la lectura. Había un problema en la traducción de «overlapping». ¿Cómo podía decirse en francés? A Odile se le ocurrió una palabra apropiada en francés y nos marchamos a París. Sentía tanta desconfianza hacia la extraña palabra que al llegar le pregunté a François Jacob cuál era la traducción francesa de «overlapping». «Oh», me contestó, «simplemente decimos oh-ver-lap-pang».

Me gustaría poder decir que la charla fue un éxito. Empecé leyendo bien y cuidadosamente, pero a medida que me fui entusiasmando mi pronunciación se volvió cada vez más disparatada. La discusión, principalmente en francés, me agotó considerablemente. Después de la charla le pregunté a François cómo creía que había ido. «No fue mal» dijo con tacto, «pero no eras tú mismo». Con la falta de espontaneidad y de bromas, me di cuenta de lo que quería decir. Desde entonces no intenté jamás dar una charla en una lengua extranjera, aunque mi acento en francés haya mejorado un poco con el paso del tiempo.

Ahora estaba claro que el código no era solapante, pero esto planteó inmediatamente un nuevo problema. Si el código se leía como una secuencia de tripletes no solapantes ¿cómo sabíamos dónde empezaban? Dicho de otra forma, si imaginásemos que los tripletes correctos estuvieran puntuados con comas (por ejemplo, ATC, CGA, TTC,…) ¿cómo sabría exactamente la célula dónde debía poner las comas? La idea obvia, comenzada al principio (fuera este lo que fuera) y seguida con pasos de tres nucleótidos, parecía demasiado simple y pensé (equivocadamente) que debía haber otra solución. Se me ocurrió tratar de construir un código con las propiedades siguientes. Si se leían en la fase correcta, todos los tripletes tendrían «sentido» (es decir, codificaban por un aminoácido u otro), mientras que todos los tripletes fuera de fase (los que se formaban a través de las comas imaginarias) serían «sin sentido», es decir no habría adaptador para ellos y por tanto no codificarían para ningún aminoácido. Mencioné esta idea a Leslie Orgel, quien inmediatamente se dio cuenta de que para un código así el número máximo de tripletes con sentido sería de veinte. Un triplete como AAA debería ser sin sentido, ya que de lo contrario la secuencia AAA, AAA podría leerse fuera de fase. (Ya por entonces suponíamos tácitamente que un aminoácido podría ser seguido por cualquier otro). Esto eliminaba cuatro de los sesenta y cuatro tripletes. Si el triplete XYZ tenía sentido, las permutaciones cíclicas YZX y ZXY deberían ser sin sentido, por tanto el número máximo de tripletes con sentido era 60/3 = 20. Entonces el problema era: ¿existe un conjunto de veinte tripletes que tengan esta propiedad? Me encontraba en cama con un fuerte catarro, pero descubrí que podía llegar fácilmente hasta diecisiete. Leslie mencionó el problema a John Griffiths, quien encontró veinte con las propiedades correctas. Pronto hallamos otras varias soluciones (más numerosas permutaciones) y por tanto no había duda de que podía existir tal código. Encontramos incluso un argumento plausible para demostrar por qué podría ser útil.

El problema de encontrar una solución teniendo veinte tripletes con sentido no es, en realidad, algo difícil. Poco más tarde viajé en un vuelo nocturno de los Estados Unidos a Inglaterra. Mientras esperaba para subir a bordo me encontré con Fred Hoyle, el cosmólogo. Me preguntó lo que estaba haciendo y le expliqué la idea del código sin comas. A la mañana siguiente, cuando el avión se acercaba a la costa inglesa, me vino a ver a mi asiento con una solución en la que había trabajado durante la noche.

Naturalmente Orgel, Griffiths y yo estábamos excitados con la idea de un código sin comas. Parecía muy bonito, casi elegante. Se introducen los números mágicos 4 (las 4 bases) y 3 (el triplete), y sale el mágico 20, el número de aminoácidos. Sin demora escribí esta idea para el Club de la Corbata de RNA. Sin embargo, no estaba seguro. Me di cuenta de que no teníamos evidencia alguna para el código, aparte de la sorprendente aparición del número veinte. De haber aparecido otro número hubiéramos descartado la idea, buscando otro código que condujera a los veinte aminoácidos, así que el número veinte en sí mismo no era evidencia que confirmase nada.

A pesar de mi prevención, el nuevo código atrajo alguna atención. Después de que cuatro personas me pidieran autorización para citar mi artículo (una nota del Club de la Corbata RNA no valía lo mismo que una publicación) decidimos escribirlo para los Proceedings of the National Academy of Sciences de los Estados Unidos, donde apareció en 1957. Una descripción del mismo salió incluso en un libro de divulgación titulado The Coil of Life, escrito por Ruth Moore, aunque no se publicó hasta 1961, momento en el que ya no creíamos en la idea.

Dado que en el código sin comas cada aminoácido tenía justo un triplete, debería haber sido posible, conociendo qué aminoácido correspondía a cada triplete, deducir la composición en bases del DNA, suponiendo que todo él codificara para proteína, a partir de la composición media en aminoácidos de todas las proteínas. Debido a que esta última era muy similar en todos los organismos (aunque ahora sabemos que hay pequeñas variaciones) cabía suponer que las moléculas de DNA tendrían en todas las especies una composición muy semejante. Cuando fueron haciendo mediciones, especialmente en diferentes tipos de bacterias, quedó en evidencia que no era así. Desde luego, en todos los casos la cantidad de A era igual a la cantidad de T (A = T), ya que el apareamiento de las bases lo requería y, por la misma razón, G = C, pero la estructura del DNA no ponía ninguna restricción en la relación de A + T a G + C y esta relación apareció muy variable de un organismo a otro. Esto hacía probable que el código sin comas fuera erróneo.

La caída final vino de dos direcciones. Nuestro trabajo en mutantes de fase descrito en el capítulo 12 lo hacía improbable, si bien recibió un golpe más decisivo de Marshall Nirenberg cuando éste demostró que el poly U (una forma simple de RNA) codificaba para polifenilalanina (ver página 149), mientras que en un código sin comas UUU debería ser un triplete sin sentido. Finalmente el código genético correcto, confirmado por muchos métodos, ha demostrado claramente que la idea era errónea. No obstante, es posible que jugara un papel en el origen de la vida, cuando el código comenzó a evolucionar, pero esto es pura especulación.

La idea de los códigos sin coma atrajo la atención de algunos combinatorialistas, en particular la de Sol Golomb. No habíamos conseguido resolver el problema de enumerar todos los posibles códigos de tripletes solapantes (con cuatro letras), aunque hubiéramos encontrado más de una solución. Esta enumeración fue encontrada por Golomb y Welch, usando un argumento muy claro (que debiéramos haber visto nosotros mismos) como parte clave de la demostración. El problema fue también resuelto más o menos al mismo tiempo por el matemático holandés H. Freudenthal.

El código fue resuelto (ver apéndice B) por métodos experimentales, no por la teoría. Quienes contribuyeron principalmente fueron los grupos de Marshall Nirenberg y de Gobind Khorana. El equipo de un Premio Nobel anterior, Severo Ochoa, hizo también contribuciones importantes. A medida que el código fue apareciendo, se trató de conjeturar el todo a partir de las partes, pero en general no hubo éxito. En algún aspecto, el código se encuentra en el centro de la biología molecular de la misma forma en que la tabla periódica de los elementos constituye el centro de la química, pero hay una profunda diferencia. La tabla periódica es probablemente cierta en cualquier lugar del universo y de especial referencia en los lugares que tienen la misma temperatura y presión que la Tierra. Si hay vida en otros mundos, y si esta vida utiliza ácidos nucleicos y proteínas (lo que no es seguro), parece muy probable que ahí el código fuera sustancialmente diferente. Existen incluso pequeñas variaciones con respecto a él en algunos organismos que tenemos en la Tierra. El código genético como la vida misma, no es un aspecto de la naturaleza eterna de las cosas sino, al menos en parte, producto de un accidente.