Inicio Noticias CIBERSEGURIDAD / Una nueva herramienta detecta cuándo los modelos de IA de...

Noticias

CIBERSEGURIDAD / Una nueva herramienta detecta cuándo los modelos de IA de lenguaje visual están «alucinando»

Por

junio 19, 2026

Los investigadores han desarrollado una nueva herramienta para ayudar a detectar cuándo la salida de un modelo de visión-lenguaje se basa en la imagen y cuándo puede depender demasiado de su propio texto generado, provocando desviaciones o «alucinaciones». El sistema se considera un medio para mejorar la seguridad y la confiabilidad de estos modelos de IA.

Un equipo de Los Alamos National Laboratory, en Estados Unidos, ha presentado Prelim Attention Score (PAS), una herramienta capaz de detectar cuándo un modelo de visión y lenguaje empieza a “alucinar”, o sea que describe objetos o detalles que no están en la imagen o que no se corresponden con la realidad. El sistema funciona como un monitor interno en tiempo real y, según los científicos, puede ayudar a hacer más fiables aplicaciones de IA en ámbitos sensibles.

Detectando las «alucinaciones» de la IA

Los modelos de visión y lenguaje se han vuelto esenciales para tareas como describir imágenes, responder preguntas sobre documentos o interpretar diagramas. Pero su gran debilidad sigue siendo que en ocasiones se vuelven poco fiables: a veces “ven” cosas que no están en la imagen. Ese fenómeno, conocido como «alucinación», aparece cuando el sistema genera una respuesta inconsistente con la imagen de entrada o directamente «inventa» objetos, relaciones o detalles.

En ese contexto, PAS permite detectar cuándo el modelo empieza a apoyarse demasiado en su propio texto generado y se aparta de la evidencia visual. Según una nota de prensa, el sistema actúa como un monitor interno del modelo en tiempo real, y necesita poca carga computacional adicional.

La lógica de PAS es sencilla: examina cómo el modelo distribuye su atención entre la imagen, la instrucción textual y sus propias palabras previas. Si el sistema detecta que la respuesta avanza más por inercia lingüística que por señal visual, eleva una alerta de posible «alucinación». Cuanto más cercana a cero es la calificación, menor es la probabilidad de que la salida esté desalineada con la imagen.

El sistema analiza la atención interna del modelo para señalar cuándo una respuesta deja de estar anclada en la imagen. / Crédito: Jaehyun Kim en Unsplash.

Una solución para aplicaciones críticas

De acuerdo a un artículo publicado en Interesting Engineering, esa capacidad resulta especialmente valiosa porque muchos modelos de visión y lenguaje con IA construyen una respuesta paso a paso, usando lo ya dicho para decidir lo siguiente. En ese proceso, un error inicial puede arrastrar a toda la respuesta. PAS se propone precisamente como una capa de control para detectar el momento en que esa deriva comienza.

Fuente

CIBERSEGURIDAD / Una nueva herramienta detecta cuándo los modelos de IA de lenguaje visual están «alucinando»

Por las mañanas desayuno café con huevos y aguacate

El CUPRA Tavascan estrena versión y cambia de liga

ESTATUTO MARCO | Los médicos cierran su quinta semana de paros...

Fitch eleva el rating de CriteriaCaixa a ‘A-‘ gracias a sus...

Un día de pesca entre amigos que culmina con la captura...

ESTATUTO MARCO | Los médicos cierran su quinta semana de paros...

Sánchez abre el margen para tener comicios desde enero

La naked a la europea

JORNADAS BANCA CECA | La banca reclama una regulación más unida...

OUIGO amplía el “Verano Joven” ofreciendo un 10% extra de descuento...

Primer Encuentro Regional de Apoyo y Acompañamiento a los Pacientes con...

El director general de Ingresos y Operaciones del Atlético de Madrid...

Jairo Concha, en la mira de un bicampeón de la Copa...

El Getafe tendrá que fichar 14 futbolistas

FADE exige al Principado “menos diagnósticos la economía de Asturias y...