La transmisión de video 3D volumétrico da un paso decisivo hacia su uso masivo: investigadores estadounidenses han desarrollado una técnica capaz de reducir el enorme peso de estas escenas y adaptarlas a los formatos de video que se usan actualmente en la red. El avance abre la puerta a nuevas experiencias en conciertos, deportes y gemelos digitales.
Un nuevo método llamado PackUV, diseñado por especialistas de la Universidad de Brown, en Estados Unidos, y que será presentado en la conferencia CVPR 2026, en Denver, comprime datos de video 3D volumétrico en formatos de video cotidianos, acercando potencialmente las experiencias de video inmersivas a los televisores y ordenadores domésticos.
La idea de ver un acontecimiento desde cualquier punto dentro de la escena está cada vez más cerca del mercado audiovisual masivo. De acuerdo a una nota de prensa, la nueva tecnología permitirá hacer viable la transmisión, el almacenamiento y la reproducción de video volumétrico en dispositivos de uso doméstico.
El problema del caudal de datos
El video volumétrico no es simplemente un clip en 360 grados: se trata de una reconstrucción tridimensional de una escena capturada con múltiples cámaras sincronizadas, que luego puede explorarse desde distintas perspectivas, casi como si el espectador caminara dentro de la acción.
Esa promesa abre posibilidades llamativas para conciertos, deportes o cine, pero también expone el gran cuello de botella del formato: la cantidad de datos es enorme y los sistemas actuales de Internet no fueron pensados para manejar ese caudal de información. Un clip de 30 minutos, advierten los investigadores, puede crecer hasta ocupar terabytes.
PackUV promete resolver el problema mediante una técnica de representación 3D de última generación, conocida como 3D Gaussian splatting, que codifica color, opacidad y forma en un espacio tridimensional. El avance consiste en transformar esa escena 4D (espacio más tiempo) en una imagen 2D estructurada y multiescala, de modo que el material resultante pueda empaquetarse como un video normal y circular por los mismos códecs que ya sostienen gran parte del ecosistema digital, desde servicios de streaming hasta plataformas de video online.
Gemelos digitales del mundo real
Los métodos anteriores funcionaban bien en secuencias breves, pero tendían a fallar cuando un objeto salía y volvía a entrar en cuadro o cuando aparecían movimientos nuevos en medio de la toma. La solución fue dividir los videos extensos en tramos más pequeños y reiniciar con mayor frecuencia el seguimiento de los objetos.
Con ese enfoque, el nuevo sistema puede renderizar escenas complejas de hasta 30 minutos sin colapsar. Para probarlo, los expertos reunieron lo que consideran el mayor conjunto de datos multivista ensamblado hasta hoy, grabado con entre 50 y 90 cámaras sincronizadas.
Serán importantes las aplicaciones en entretenimiento y deportes, pero también en manufactura y otros entornos donde interesa construir gemelos digitales del mundo real, o sea réplicas fieles de procesos específicos y concretos. Sin embargo, el salto hacia la transmisión cotidiana dependerá de cuánto se puedan bajar los costes, simplificar los flujos de trabajo y garantizar compatibilidad en entornos reales.












