En los últimos meses, el uso que se le está dando a la Inteligencia Artificial (IA) ha sido motivo constante de controversia debido a los avances cada vez más perfeccionados de esta tecnología.
En medio de ese panorama, Runway, una empresa radicada en Nueva York cuyos cofundadores son chilenos, está desarrollando videos instantáneos tan solo con escribir un par de palabras, debido a la ayuda de la IA.
Creada como una forma de incorporar la IA en el mundo del arte y el entretenimiento, los chilenos Cristóbal Valenzuela y Alejandro Matamala, en conjunto con el griego Anastasis Germanidis, fundaron Runway en el año 2018. Se trata de una de las compañías que se está encaminado para lograr la creación de clips en unos minutos, a las que también se suman otras compañías como Meta y Google.
Después de la aparición de ChatGPT, estos sistemas generadores de video podrían tratarse del siguiente paso avanzado de la IA. Al mismo tiempo, es posible que llegue a convertirse en una nueva herramienta más rápida en la producción y edición de contenido audiovisual.
Un artículo de The New York Times explicó cómo el arquitecto de software de Runway, Ian Sansavera, siguió el proceso paso a paso de esta tecnología para obtener buenos resultados.
En el sistema, Sansavera anotó la frase “Un río tranquilo en el bosque” cuando se le preguntaba qué es lo que deseaba ver en un video. Apenas dos minutos después de escribirlo, apareció un breve clip con las características que había pedido: el agua corría en el río y a un costado estaban los árboles.
Esta tecnología pertenece a la denominada IA generativa, una variante que permite producir imágenes, videos y textos mediante datos entregados. Además del sistema generador de videos, como el que está haciendo Runway, otro producto de la IA generativa es el ya conocido ChatGPT desarrollado por OpenAI, así como también Midjourney.
En octubre del año pasado, Meta y Google presentaron sus propios sistemas generadores de videos, los que también podían crear escenas con descripciones de texto. Sin embargo, hasta ahora no han salido a la luz para que el público los pueda utilizar.
Para Cristóbal Valenzuela, ingeniero comercial y CEO de Runway, esta herramienta debe salir definitivamente a la luz de los usuarios ya que no vale la pena dejarla en secreto.
“Esta es una de las tecnologías más impresionantes que hemos construido en los últimos cien años. Necesitas que la gente realmente lo use”, afirmó Valenzuela a The New York Times. Entre los clientes que han utilizado el software de Runway está la película Todo en todas partes al mismo tiempo, que en la última edición de los Premios Oscar se llevó 7 galardones.
Si bien también existen otras técnicas de IA para generar escenas, como lo son los denominados deepfakes, el generador de videos impulsado por Runway opera de una forma mucho más veloz: con solo escribir una corta frase en el computador, se puede crear un registro instantáneo.
Al describir la escena que se desea observar en el video es una buena idea se incluyan acciones, como “un río en medio del bosque” o “un gato durmiendo”. También se pueden pedir escenas más surrealistas. Sin embargo, hay que considerar que si no se describe de forma correcta la petición, puede que el resultado no sea el correcto.
Una vez que esté lista la descripción, se debe apretar Enter y en un tiempo aproximado de dos minutos la plataforma tendrá el video listo.
Por ahora los clips generados con IA duran cuatro segundos. En algunos casos, las imágenes son poco fluidas a simple vista. Al mismo tiempo, hay videos que son un tanto tétricos y pueden llegar a causar un poco de miedo.
“En este punto, si veo un video de alta resolución, probablemente voy a confiar en él. Pero eso cambiará bastante rápido”, señaló Phillip Isola, académico del Instituto de Tecnología de Massachusetts especializado en IA, en diálogo con el medio estadounidense.
Podría decirse que lo que genera el software de Runway es la agrupación de cientos de píxeles hasta conseguir que se genere un clip lo más cercano posible a la realidad.
En el caso de la startup , ese proceso sucede de la siguiente manera: al momento de poner la frase para que el sistema genere el video, también se crea automáticamente un listado con los peculiaridades que se están solicitando. Luego, una red neuronal del sistema denominada modelo de difusión es la que compone la escena solicitada, reúne los píxeles necesarios y deja el video terminado.
“Un video es solo una serie de cuadros, imágenes fijas, que se combinan de una manera que da la ilusión de movimiento”, explica Valenzuela. “El truco radica en entrenar un modelo que comprenda la relación y la consistencia entre cada cuadro”.
Si bien algunas técnicas de IA generativa siguen presentando ciertos errores, los especialistas en el área reflexionan que eso podría ir mejorando cada vez más mientras las compañías fortalezcan sus software con más datos.
Susan Bonser, escritora de Pensilvania que en el último tiempo ha probado la técnica de para generar videos instantáneos, así lo cree. “En los viejos tiempos, para hacer algo remotamente como esto, tenías que tener una cámara. Tenías que tener accesorios. Tenías que tener una ubicación. Tenías que tener permiso. Tenías que tener dinero. No tienes que tener nada de eso ahora. Puedes simplemente sentarte e imaginarlo”.
En esa misma línea, Cristóbal Valenzuela destaca que la IA podría cambiar la forma en que concebimos la industria del arte y el entretenimiento.
“Va a impactar a todas las empresas que distribuyen vídeo, incluido YouTube”, dijo al diario español El Confidencial. “Para mí la IA en temas de vídeo es una nueva cámara. Y una de las cosas que va a pasar y que ya está ocurriendo es que distribución y creación se van a fusionar. No estamos muy lejos de generar vídeos y películas de forma automática”.