Tras la demanda del NYT contra OpenAI y Microsoft por haber hecho uso de sus noticias para entrenar sus LLM, sabíamos que no iba a pasar mucho tiempo hasta que esta polémica llegara a otros soportes del conocimiento, más allá del texto. Superada la fase del audio, en la que, pese al enfado de Bad Bunny, ha quedado claro que clonar cualquier voz humana o crear una nueva es casi un juego de niños, teníamos que llegar a las que faltan. Hablamos de la imagen y, próximamente en sus pantallas, de esa misma imagen pero en movimiento: del vídeo.
La primera de ellas, la imagen estática, ya está más que comprometida. La liebre saltó en esta ocasión por el filtrado “accidental” (“accidental” es una palabra que hay que entrecomillar cada vez más a menudo) de los nombres de más de 16.000 artistas cuya obra habría sido utilizada sin permiso en el entrenamiento de Midjourney, uno de los grandes nombres en la actualidad de la generación de imágenes por IA junto a Stable Difussion o Dall-e, la IA generadora de imágenes de OpenAI. Parte de esos 16.000 nombres ya estaban incluidos en una demanda colectiva presentada por artistas el pasado año, en una denuncia que incluía a Stability AI, creadora de Stable Difussion, y a Midjourney, además de DevianArt, una página web de una comunidad internacional de artistas en línea donde podían mostrar gratuitamente sus trabajos de fotografía, arte digital y tradicional, etc. Estas dos últimas utilizan el software de Stable Difussion que permite crear imágenes a partir de texto.
La novedad de esta nueva y mucho más amplia lista está en su origen: una hoja de cálculo alojada en Google Docs con la que trabajaban desarrolladores de Midjourney. Esta lista denominada “Midjourney Style List” habría sido, según la publicación mensual londinense The Art Newspaper “supuestamente recuperada de los desarrolladores de Midjourney durante un proceso de refinamiento de la capacidad del programa para imitar obras de artistas y estilos específicos”. Esta publicación especializada en arte señala la serie de tweets publicada por un diseñador que trabaja para la empresa de videojuegos Riot Games, llamado Jon Lam, como el origen de la filtración. El perfil de Lam en X contiene pantallazos de una supuesta conversación entre desarrolladores de Midjourney, en la que participa incluso el director ejecutivo, David Holz, hablando sobre la disponibilidad de las fuentes donde tendrían acceso a los contenidos para imitarlos en la creación de imágenes y dando la bienvenida a los nuevos 16.000 creadores al entrenamiento del programa. Puro sarcasmo.
La clave de que todo esto se hacía sin ninguna autorización de los dueños legítimos de esos contenidos está en la respuesta de otro miembro del chat al abordar el espinoso asunto de los derechos de autor: “…todo lo que tienes que hacer es usar esos conjuntos de datos extraídos y [se entiende por el contexto que se habla de la propia IA] olvidará convenientemente lo que usaste para entrenar el modelo. Problemas legales (…) solucionados para siempre”. De momento, eso no es del todo cierto. A pesar de que el juez rechazó en octubre pasado la demanda por defectos de forma lo hizo solo en parte, sin entrar en la cuestión de si Midjourney era o no culpable de haber infringido los derechos de autor al utilizar los 5.850 millones de fotografías contenidas en el conjunto de datos LAION-5B, utilizado en su entrenamiento. La demanda se reformuló y fue presentada de nuevo en noviembre.
No es un indicio tranquilizador que el acceso al documento que incluía la lista fuera rápidamente cerrado en cuanto Jon Lam lo hizo público, aunque es difícil esconder algo en la Red cuando unos cuantos cientos de miles lo han compartido, por lo que aún está visible al completo en Internet Archive y en varios tweets publicados por el creador de videojuegos. No sería desatinado pensar que esta publicación irregular y la anterior demanda (aquí pueden recuperar el PDF) están de alguna forma relacionados, porque Lam insistió en su hilo de X que los posibles afectados por el uso inadecuado de su trabajo se buscaran en la lista y se personaran, si estaban allí, en dicho proceso judicial. No todos son creadores independientes ni mucho menos, por lo que las seguramente importantes oficinas que gestionan los derechos de autor de creadores como Pablo Picasso, Frida Kahlo o Walt Disney, cuyos trabajos habría utilizado Midjourney ya que están presentes en la polémica lista, podrían sumarse a los denunciantes dando aún mayor peso al procedimiento legal.
La IA quiere caviar para el desayuno y la merienda pero sus entrenadores siguen pretendiendo que ese producto no debe ser más caro que unas gachas
Todo esto se produce cuando se anuncia que esta empresa empezará a entrenar modelos de vídeo en este mismo mes de enero. No hay que ser muy malintencionado cuando, tras leer este anuncio que realizaba un tuitero experto en la materia, uno se pregunta (supongo que a Netflix le pasará lo mismo): ¿con qué la estarán entrenando? Si le preguntas a Perplexity, que al menos identifica de dónde sale lo que te responde, este LLM admite sin paliativos que para entrenar una IA de vídeos hacen falta… vídeos. Blanco y en botella. Aunque también dice algo que obliga a pensar: “Es importante destacar que la calidad y diversidad de los datos de entrenamiento son cruciales para el rendimiento del modelo de IA. Los conjuntos de datos de alta calidad son esenciales para entrenar modelos de IA eficaces, y la falta de estos puede perjudicar el desarrollo de la IA. Además, los modelos de IA deben ser entrenados y ajustados continuamente para mejorar su rendimiento y precisión”.
Y es que en este proceso no vale cualquier cosa. La IA quiere caviar para el desayuno y para la merienda pero sus cuidadores siguen pretendiendo que ese es un producto no debe ser más caro que unas gachas. Es obvio que la calidad de los datos es esencial. No lo digo yo: lo dice Sam Altman, cuya empresa OpenAI ya vale 100.000 millones de dólares tras tener unos ingresos de 1.600 en 2023 y esperar que le caigan otros 750 millones en la última ronda de financiación. Altman está muy preocupado por el lío este de los derechos de autor y cree que esta cuestión, menor para él, “puede frenar el desarrollo de la IA”. Los artistas, que están utilizando ya software para “engañar” a quien usa su contenido sin pedirles permiso y lograr que la versión digital de sus creaciones parezca algo distinto de lo que es, son algunos, entre otros, de los que también están muy preocupados. Seguramente con menos ingresos que los suyos.