Hemos hallado un tesoro de variantes

Dos nuevos artículos publicados en la última edición de la revista Nature amplían el catálogo de variantes identificadas en el genoma humano, actualizando y ampliando la información de la que disponemos sobre nuestro ADN.

El primer trabajo ha sido llevado a cabo por investigadores del Laboratorio Europeo de Biología Molecular (EMBL), la Universidad Heinrich Heine de Düsseldorf (HHU) y el Centro de Regulación Genómica (CRG) de Barcelona. Para ello, han analizado el genoma de 1.019 personas pertenecientes a 26 poblaciones en cinco continentes.

El objetivo consistía en localizar variantes estructurales específicas, grandes secuencias de genes que han sido borradas, duplicadas, insertadas, invertidas o cambiadas de posición. Estas pueden implicar diferencias de miles de letras de ADN entre un individuo en otro, suplantando el lugar de otros genes e incidiendo en el riesgo de enfermedades raras y cáncer.

El equipo descubrió y categorizó más de 167.000 variantes estructurales entre los participantes. «Hemos hallado un tesoro de variaciones genéticas ocultas que estaban infrarrepresentadas hasta ahora», valora Bernardo Rodríguez-Martín, del CRG. El 50% de las inserciones de ADN y el 14,5% de las secuencias borradas se desconocían, explica, porque los estudios han usado mayoritariamente muestras de personas de ancestría europea.

Tres de cada cinco variantes se manifestaron en menos de un 1% de la población, lo que permite una mayor precisión sobre cuáles se relacionan con enfermedades de base genética y cuáles son inocuas. Esto permite reducir la lista de mutaciones sospechosas de decenas de miles a unas pocas centenas en las pruebas que pueden determinar la predisposición a sufrir síndromes o cáncer.

Rodríguez-Martín también es el desarrollador de SVAN, un software capaz de categorizar cada cambio en las líneas genéticas, «como un corta y pega». La mitad de las nuevas variantes se han encontrado en lo que antaño se consideraba como ‘genoma basura’, una «Los elementos repetitivos representan una reserva de diversidad genética rica, aunque se ha pasado por alto», afirma Emiliano Sotelo Fonseca, estudiante de doctorado en el CRG y coautor del estudio.

Entre las secuencias repetidas se encontraron «genes saltarines» capaces de autorreplicarse y pegarse alrededor del genoma. La mayor parte de esta actividad se debe a «unas pocas docenas de elementos» como el LINE-1. Este factor «particularmente hiperactivo» secuestra a un poderoso elemento regulador para hacer muchas más copias de sí mismo, dispersando material genético por el ADN.

«Nuestro trabajo muestra cómo los elementos móviles aumentan su actividad secuestrando a los interruptores que regulan el genoma», remarca Rodríguez Martín. «Esta estrategia ha sido infravalorada pero podría ayudar a impulsar enfermedades como el cáncer, y por tanto merece ser investigada en profundidad».

El segundo estudio, dirigido conjuntamente por el EMBL y la HHU, utilizó un conjunto de solo 65 personas pero combinó varios métodos de secuenciación para reconstruir los genomas humanos con un detalle sin precedentes. Se decodificaron los tramos más difíciles de leer, incluidos los centrómeros, ayudando a identificar grandes variantes genéticas desconocidas dentro de esas regiones.

«Un estudio utiliza menos potencia de secuenciación, pero una cohorte mucho más grande. El otro utiliza una cohorte más pequeña, pero con mucha más potencia de secuenciación por muestra. Esto condujo a conclusiones complementarias», afirma Jan Korbel, líder de grupo, jefe en funciones del EMBL Heidelberg y coautor principal de ambos estudios.

Ambos estudios son fruto de la re-secuenciación de personas del proyecto 1.000 Genomas, basado en la tecnología de secuenciación de «lectura corta», que solo permite leer fragmentos muy pequeños a la vez. Los avances logrados por los nuevos estudios fueron posibles gracias a la secuenciación de «lectura larga», una nueva tecnología que lee de miles a decenas de miles de letras simultáneamente.

Durante los últimos veinte años, recuerdan los autores, se ha utilizado la secuencia de ADN de una única persona como el genoma humano «estándar». Un pangenoma sería más adecuado para la medicina personalizada, ya que reflejaría la diversidad global. Ambos estudios proporcionan una hoja de ruta que permite el ensamblaje de un verdadero pangenoma humano, cuando los costos de secuenciación de lectura larga están disminuyendo.

Fuente