La comunidad científica se ha unido en un consorcio para alumbrar la IA de la ciencia, cuyo lanzamiento europeo tuvo lugar recientemente en Barcelona. Fabrizio Gagliardi, representante del BSC-CNS en ese consorcio, advierte que Europa está lejos de alcanzar el nivel de desarrollo de la IA Generativa que vemos en Estados Unidos.
Fabrizio Gagliardi ha tenido una larga carrera en el Centro Europeo de Física de Partículas de Ginebra (CERN) y ha sido director de investigación externo en Microsoft. Ahora es asesor senior de la dirección del BSC y responsable de cooperación estratégica internacional. En ese cargo, gestionó la participación del BSC en el Trillion Parameter Consortium y dirigió la primera conferencia inaugural celebrada recientemente en Barcelona. En la siguiente entrevista exclusiva con T21/Prensa Ibérica, Gagliardi explica los entresijos y perspectivas de este proyecto, que pretende posibilitar la aplicación a gran escala de la Inteligencia Artificial a la investigación científica.
¿En qué momento se encuentra el proyecto Trillion Parameter Consortium?
El Trillion Parameter Consortium (TPC) comenzó su actividad en 2023 por iniciativa de centros de supercomputación: Riken-CCS, de Japón, el laboratorio nacional Argonne, de EE.UU., y el Barcelona Supercomputing Center. Los primeros encuentros del TPC se celebraron en EE.UU. y en Australia, en el marco del evento Supercomputing Asia. El primer encuentro en Europa tuvo lugar en Barcelona.
¿Qué aportaciones más significativas se realizaron durante la reunión de Barcelona del 19 al 21 de junio?
El encuentro en Barcelona reunió a la comunidad del TPC en Europa, con más de 180 científicos e investigadores de Europa y del resto del mundo. Durante los tres días del evento, se discutieron los siguientes pasos de los grupos de trabajo, que abordan distintos aspectos de la rápida adopción de la IA generativa en la investigación científica.
¿Cómo la IA Generativa está reconfigurando la ciencia y la ingeniería, y qué se está haciendo para su adopción en diversos campos del conocimiento?
La IA Generativa está provocando un giro copernicano en la forma en la que hacemos ciencia. Por ejemplo, el procesamiento de lenguaje natural, con sistemas basados en modelos de lenguaje de gran tamaño (LLMs, por sus siglas en inglés), se utiliza en una amplia gama de ámbitos científicos y sociales. Un resultado notable de ello es el creciente número de “co-pilotos” basados en IA que ayudan, tanto al público en general, como a los investigadores en particular, a escribir textos o código informático, por ejemplo.
¿En qué medida puede Europa aprovechar las oportunidades de colaboración que generan los proyectos de IA generativa?
Europa está, en este momento, lejos de alcanzar el desarrollo de IA Generativa que vemos en EE.UU. y China, aunque no escuchamos demasiadas novedades desde China. Desde el punto de vista europeo, nos enfrentamos al problema de que buena parte de las herramientas de IA Generativa pertenecen a un puñado de empresas privadas, especialmente de EE.UU., con sistemas y formatos de datos cerrados. Esos servicios son de una calidad cada vez mayor y se ofrecen prácticamente gratis a los usuarios, por supuesto a cambio de datos. Por otra parte, Europa otorga financiación pública al desarrollo y producción de datos. En este contexto, si no se desarrollan sistemas y herramientas que puedan competir con la oferta comercial, nos arriesgamos a que, en pocos años, la mayor parte de los datos científicos de origen europeo sean almacenados y gestionados por plataformas comerciales fuera de la jurisdicción europea.
¿Qué papel va a jugar el BSC-CNS en el desarrollo de este proyecto?
El BSC cuenta con los tres recursos más importantes para jugar un rol destacado en esta iniciativa. Tenemos la capacidad de cómputo, un plan financiado por España y Europa para extender esa capacidad hacia los requerimientos de servicios de IA, y un grupo de científicos e investigadores que ya están trabajando para usar la IA Generativa en el desarrollo de soluciones innovadores a los grandes retos de la sociedad.
¿Qué puede aportar el Marenostrum 5 a los desarrollos del Trillion Parameter Consortium?
El potencial del MN5 va más allá de ser una de las supercomputadoras más potentes del mundo. MN5 es una plataforma experimental, flexible y de rápida adaptación para desarrollar aplicaciones de IA Generativa en diversos ámbitos, desde Ciencias de la Vida hasta modelos de lenguaje de gran tamaño, desde el estudio del clima, hasta la ingeniería.
La IA de la ciencia va tomando forma.