La determinación de la secuencia de proteínas ha sido habitualmente un proceso complejo y tedioso, limitado por la diversidad de aminoácidos y la enorme variabilidad estructural que presentan estas moléculas, entre otros factores. Ahora, la integración de algoritmos de Inteligencia Artificial (IA) en este ámbito ha abierto nuevas posibilidades para acelerar y perfeccionar el análisis de proteínas, un avance que podría ser crucial en diferentes áreas de la biología y la medicina.
La inteligencia artificial (IA) está revolucionando la secuenciación de proteínas al permitir su identificación a partir de sus secuencias de aminoácidos: esta tecnología es más rápida que los métodos tradicionales y puede identificar proteínas desconocidas, algo esencial en diagnósticos médicos, estudios ambientales y arqueología, entre otros ámbitos.
Según informa Science, un reciente trabajo científico presentado en la revista Nature Machine Intelligence detalla las características de InstaNova, un sistema de IA que identifica proteínas patógenas en heridas y proteínas desconocidas en muestras de agua de mar.
Precisión y rapidez
InstaNova, junto con otros más de 20 sistemas de IA desarrollados en los últimos años, está transformando el campo de la proteómica. Estas herramientas son utilizadas por investigadores en diversas áreas, desde biología evolutiva hasta arqueología, para analizar proteínas que no están representadas en bases de datos tradicionales.
Estos algoritmos pueden aprender patrones sutiles en los datos experimentales, que de otro modo pasarían desapercibidos con métodos convencionales. Así, la IA no solo permite una mayor velocidad en el procesamiento de muestras, sino que también mejora la precisión en la asignación de secuencias proteicas.
Hasta hoy, la identificación de proteínas implicaba fragmentarlas en péptidos, medirlos con espectrometría de masas y compararlos con bases de datos conocidas. Sin embargo, hasta el 70% de los péptidos en las muestras no tienen coincidencias en dichas bases. Este es el punto en el cual destacan las nuevas IA, al calcular los pesos de todos los posibles fragmentos de péptidos y ensamblarlos en proteínas completas.
De acuerdo a una publicación de Open Tools, modelos como Casanovo, presentado en 2021, y el más reciente InstaNova, utilizan redes neuronales profundas para aprender las combinaciones más probables de aminoácidos, de manera similar a cómo modelos de lenguaje como ChatGPT aprenden reglas sintácticas. InstaNova, además, incorpora un método específico que otorga mayor precisión a sus resultados, eliminando «ruido» en los datos. En distintas pruebas, este sistema identificó un 42% más de péptidos que su predecesor.
Aplicaciones sin límites
Las aplicaciones prácticas de InstaNova y otros modelos de IA similares incluyen la identificación de péptidos únicos en heridas infectadas y proteínas bacterianas en estas muestras, superando significativamente las búsquedas tradicionales en bases de datos. También se ha empleado exitosamente en arqueología, identificando proteínas en muestras con cambios químicos por el paso de los años, como restos de animales en sitios Neandertales y proteínas de peces en vasijas antiguas.
Asimismo, el uso de la IA en proteómica complementa otros avances tecnológicos recientes. Por ejemplo, DeepMind de Alphabet sorprendió al mundo científico con AlphaFold, una herramienta que predice la estructura tridimensional de las proteínas con una precisión sin precedentes.
Sin dudas, esta tecnología representa un cambio significativo en la investigación proteómica, con un impacto profundo en diversas disciplinas científicas. Los avances recientes subrayan su potencial para resolver desafíos complejos y trabajar con muestras que anteriormente eran imposibles de aprovechar a través de los métodos convencionales.
La mejora en la velocidad y exactitud de estos procesos permite explorar interacciones proteicas, comprender mejor las rutas metabólicas y descubrir nuevos biomarcadores. Esto resulta especialmente relevante en áreas como el cáncer o las enfermedades neurodegenerativas, donde la detección temprana y la comprensión de las alteraciones moleculares pueden marcar una diferencia clave en el manejo clínico.