¿Cómo se les da nombre a los genes?
Nombrar algo con claridad y precisión es la única forma práctica de reconocerlo. Los genes, como toda entidad física, química o biológica, necesitan ser nombrados adecuadamente para poder investigar sus estructuras, sus funciones y sus interrelaciones, y poder reconocerlos, señalarlos y describirlos.
La primera norma aceptada desde hace mucho tiempo por todos los genetistas es que los genes no deben ser denominados con nombres de personas y, menos aún, con los nombres de sus descubridores. Por esta razón, nunca vamos a encontrar un gen que se llame Collins, Watson, Crick o Monod. Lo que sí vamos a encontrar casi invariablemente son apelativos como MIR17, FOXP2, TNFRSF21 o BRCA1. Pero ¿qué quieren decir estas letras y números tan extraños? Pues son acrónimos de MIR17 = microRNA 17, FOXP2 = forkhead box P2, TNFRSF21 = TNF receptor superfamily member 21 o BRCA1 = BRCA 1 DNA repair associated. En los genes humanos, generalmente el nombre del gen se escribe en mayúsculas y la proteína que codifican en minúsculas, lo que aún no está del todo normalizado. La denominación de los genes ha ido variando con el tiempo en función de lo que sabemos de ellos, de su cantidad y, también, con el reconocimiento de las crecientes complicaciones evolutivas de los organismos vivos. No es lo mismo determinar las funciones de los genes bacterianos, formados por células procariotas, que las de los genes de células con núcleos, eucariotas, que conforman órganos, tejidos y organismos completos.
Partiendo de los trabajos pioneros de Alfred Sturtevant, desde 1911 solían nombrarse los genes siguiendo las características que producían cuando estaban alterados: Así, se les denominaba “yellow gen” o “scarlett gen” cuando modificaban el color de los ojos de la mosca Drosophila a amarillo o rojo brillante. Esto ocurría porque casi invariablemente se encontraba primero la modificación anatómica y, luego, el gen modificador. Esta forma de nombrar se evita actualmente, sobre todo en los genes humanos y de los vertebrados, donde se prefiere la referencia a la proteína específica que codifican.
Desde la década de 1990 el comité internacional aceptado por todos los genetistas (HGNC o Comité de Nomenclatura de los Genes Humanos de la Organización del Genoma Humano o HUGO) tiene autoridad para recibir y aprobar, o desaprobar, las propuestas de nombres de nuevos genes descubiertos. Este comité estipula o recomienda que los nombres de los genes deben ser cortos, memorizables, fácilmente pronunciables, específicos y referidos, por lo menos en parte, a las proteínas que codifican. No acepta nombres con números romanos ni letras griegas, no deben incluir la letra G/g como sinónimo de gen ni la letra H/h como sinónimo de humano. Se debe minimizar la puntuación. Deben escribirse en inglés. A cada gen se le asigna un único símbolo dentro del genoma (lo que no se logra siempre, ya que, por ejemplo, hay por lo menos 6 genes que incluyen las letras CAP). No deben hacer referencia a animales, a especies, tejidos ni a localizaciones cromosómicas. Se deben evitar determinadas combinaciones de letras que se utilizan con sentido específico para otras cosas, por ejemplo BP, que se utiliza para “binding protein” y, por último, la nomenclatura no debe ser demasiado folclórica, jocosa, ofensiva, peyorativa ni con doble sentido, aunque existen genes con nombres muy simpáticos que veremos en otro artículo.
Los genes que codifican una misma familia de proteínas tienen una raíz común para el nombre, pero se utilizan números arábigos para diferenciarlos, como FOXP1, FOXP2, etc. Si no se conoce su función, se suele utilizar la mención a dominios estructurales o a su parecido con otros genes de la misma especie.
Una curiosidad: algunos nombres se han cambiado para evitar confusiones con documentos procesados en Excel. Se ha dado el caso de que el algoritmo de Excel confunde ciertos nombres con fechas, por ejemplo MARCH1 lo cambia a 1-MAR (primero de marzo).
NOTA del autor: este breve artículo no es más que una simplificación con fines divulgativos del complicado proceso de nombrar los genes. La descripción completa de las directrices de nomenclatura del HGNC pueden encontrarse en la página web: http://www.genenames.org/guidelines.html.