
MidJourney ha lanzado su primer modelo de generación de videos AI, V1, que marca el cambio de la compañía de la generación de imágenes a la creación de contenido multimedia completo. A partir de hoy, los casi 20 millones de usuarios de MidJourney pueden animar imágenes cargadas o generadas por IA a través del sitio web.
El CEO de MidJourney, David Holz, dijo que el modelo V1 fue el siguiente paso de la compañía hacia su destino final, creando modelos de IA "capaces de simulaciones en el mundo abierto en tiempo real". La compañía también dijo que tenía planes más grandes para sus modelos de video AI que solo generar B-Roll para películas o comerciales de Hollywood para la industria publicitaria.
Nick St. Pierre, director creativo y chelín no oficial de Midjourney, observó que el V1 solo hizo conversiones de imagen a video. A los usuarios se les permitió cuatro generaciones de 24 fps a 480p por clip, y trabajaron con cualquier imagen de relación de aspecto. También señaló la rentabilidad de V1, alegando que 20 videoclips por ~ $ 4 fueron mejores que los $ 3 por video en VEO. La velocidad de generación fue notablemente más rápida.
Según Pierre, V1 tiene configuraciones personalizadas que permiten a los usuarios controlar las salidas del modelo de video. La configuración de animación de Automatic hará que una imagen se mueva al azar, y la configuración manual permitirá a los usuarios describir, en el texto, una animación específica que desean agregar a su video. Si bien los videos generados con V1 tienen solo cinco segundos, los usuarios pueden extenderlos por cuatro segundos a cuatro veces, lo que significa que los videos de V1 podrían obtener hasta 21 segundos.
¡Tuve la oportunidad de probar de @Midjourney !
Realmente impresionado por un montón de mis salidas: hace una gran diferencia comenzar desde una imagen de calidad, y la coherencia es stronG.
La promoción automática es genial. Y también es un modelo relativamente rápido y barato, que nunca duele 😅 pic.twitter.com/yvf3nn9dmc
- Justine Moore (@venturetwins) 18 de junio de 2025
El equipo de MidJourney dijo que cobraría 8 veces más por una generación de videos que una generación de imágenes típica, lo que significa que los suscriptores se quedará sin sus generaciones mensuales mucho más rápido al crear videos que imágenes. También mencionó que planeaba desarrollar modelos de IA para producir renderizado 3D y modelos de IA en tiempo real.
La forma más barata de probar V1 en el lanzamiento será suscribirse al plan básico de MidJourney de $ 10 por mes. Los suscriptores del plan profesional de Midjourney de $ 60 al mes y el mega plan de $ 120 al mes tendrán generaciones de video ilimitadas en el modo de "relajarse" más lento de la compañía. Midjourney dijo que reevaluará su precio para los modelos de video durante el próximo mes. Holz afirmó que los precios de MidJourney eran más de 25 veces más baratos de lo que el mercado había enviado antes.
"Nuestro objetivo es darle algo divertido, fácil, hermoso y asequible para que todos puedan explorar. Creemos que hemos logrado un equilibrio sólido. Aunque muchos de ustedes sentirán la necesidad de actualizar al menos un nivel para más minutos rápidos".
- David Holz , CEO en MidJourney
Según Holz, los costos reales de producir modelos y los precios cargados a mitad de junio fueron difíciles de predecir. Agregó que la compañía haría todo lo posible para dar acceso a los usuarios en este momento. Sin embargo, aclaró que el equipo de MidJourney vería a todos usar la tecnología durante el próximo mes y ajustar todo para garantizar que la empresa operara de manera sostenible.
El CEO de MidJourney presentó los planes del próximo año, alegando que el inevitable destino de la tecnología de V1 era modelos capaces de simulaciones en tiempo en tiempo real en el mundo. Básicamente, la compañía estaba buscando construir un sistema de IA que generara imágenes en tiempo real. Los usuarios podrían ordenar que se mueva en un espacio 3D donde los entornos y los personajes también se movían, y los usuarios podrían interactuar con todo.
Holz señaló que para hacer esto, la compañía necesitaba imágenes (nuestros primeros modelos de imagen), necesitaba hacer que esas imágenes se movieran (modelos de video), los usuarios debían poder moverse a través del espacio (modelos 3D), y necesitaban poder hacerlo todo rápido (modelos en tiempo real). Agregó que al año siguiente implicó construir estas piezas individualmente, liberarlas y reunirlas lentamente en un sistema unificado. El jefe de mediana edad dijo que podría ser costoso al principio, pero el producto final sería algo que todos podrían usar.
Holz prometió que más vendrían de su compañía en las próximas semanas y meses, y agregó que su equipo había aprendido mucho mientras construía modelos de video. También señaló que gran parte de este aprendizaje volvería a de MidJourney en las próximas semanas o meses. Pero por ahora, Holz dice que presione "animar", y haga que esas imágenes se muevan.
Cable de diferencia de clave : la herramienta secreta que los proyectos de cifrado utilizan para obtener cobertura de medios garantizada