MagicVideo-V2 de TikTok, la IA que puede crear videos mediante texto
Ya no solo imágenes, ahora podemos crear videos de manera sencilla.
No resulta sorprendente que los modelos de inteligencia artificial hayan alcanzado la capacidad de crear imágenes realistas en la actualidad.
Generación de videos mediante IA
Ejemplos notables como Midjourney, DALL-E 3 y Stable Diffusion han demostrado habilidades impresionantes en este campo. Sin embargo, cuando se trata de la generación de videos, la situación cambia.
Aunque existen modelos como Pika o Morph que logran resultados bastante adecuados, estos aún distan considerablemente de lo que la empresa matriz de TikTok promete el recién anunciado modelo: MagicVideo-V2.
En el sitio web del proyecto, se pueden encontrar varios videos generados mediante esta inteligencia artificial, y los resultados son realmente impresionantes. No solo destacan por el nivel de detalle que exhiben, sino también por la notable consistencia de las imágenes.
字节昨天发布的这个视频生成模型MagicVideo-V2的效果很好啊,动作幅度很大而且很自然。
与 Runway 和 SVD 相比,写实内容的细节不够丰富,纹理缺失,有一种塑料质感。
功能也很全面:
集成了文本到图像(T2I)、图像到视频(I2V)、视频到视频(V2V)和视频帧插值( VFI)模块。… pic.twitter.com/UbSxACsWKe— 歸藏 (@op7418) January 11, 2024
¿Cómo funciona MagicVideo-V2?
MagicVideo-V2 se compone de cuatro módulos esenciales: texto a imagen (T2I), imagen a video (I2V), video a video (V2V) y un modelo de interpolación de fotogramas.
Según detallan los creadores, el módulo T2I tiene la capacidad de generar una imagen de 1.024 x 1.024 píxeles en función del prompt ingresado. A continuación, el módulo I2V anima esta imagen, produciendo 32 fotogramas con una resolución de 600 x 600 píxeles.
En el tercer paso, el módulo V2V incrementa la resolución hasta alcanzar los 1.048 x 1.048 píxeles y, finalmente, el módulo de interpolación amplía la secuencia a 94 fotogramas.
Comparación con otras herramientas
Naturalmente, los creadores han compartido los resultados obtenidos al emplear el mismo prompt con diversos modelos de generación de videos mediante inteligencia artificial.
Según las imágenes proporcionadas, el modelo desarrollado por ByteDance logra resultados significativamente superiores a la competencia, aunque es justo señalar que Stable Diffusion Video y Pika se mantienen competitivos en ciertos contextos.
La discrepancia radica en que los modelos de la competencia están disponibles para su uso, mientras que MagicVideo-V2, al menos por el momento, no parece estar disponible para su evaluación.