Вт. Май 19th, 2026

Google presenta Gemini Omni: IA para crear y editar vídeos ultrarrealistas

Google ha desvelado Gemini Omni, una innovadora inteligencia artificial que promete revolucionar la creación y edición de vídeos. Presentada durante el Google I/O, esta IA va más allá de la simple generación de contenido a partir de texto.

Gemini Omni se basa en tres pilares fundamentales: la generación de vídeo hiperrealista a partir de diversas fuentes (imágenes, texto, audio), la capacidad de editar vídeos existentes con gran precisión y la creación de contenido personalizado, replicando la voz, personalidad y apariencia del usuario.

Lo más destacable es que Gemini Omni ya está disponible para los suscriptores de los planes Google AI Plus, Pro y Ultra a través de la aplicación Gemini. Además, se ha confirmado que esta tecnología llegará de forma gratuita a YouTube Shorts.

En YouTube Shorts, la función ‘Avatar’ de Gemini Omni permitirá a los usuarios crear vídeos verticales de sí mismos utilizando su propia voz y aspecto. Con tan solo una instrucción de texto (prompt), será posible generar vídeos con continuidad y control total sobre las escenas, sin necesidad de grabarse directamente.

Un salto en realismo y comprensión

A diferencia de modelos anteriores como Veo, Gemini Omni destaca por su mayor realismo y una comprensión del lenguaje natural más profunda. Al alimentarse del conocimiento y razonamiento de Gemini, es capaz de interpretar detalles complejos y generar cada elemento del vídeo de forma extremadamente realista. Por ejemplo, al solicitar un vídeo de alguien nadando en el océano Índico, considerará las características específicas de dichas aguas para recrear cada detalle con precisión.

Uno de los avances más impresionantes es su capacidad para generar textos, carteles o incluso personas escribiendo con una fidelidad asombrosa. La fluidez de los movimientos y la calidad del audio son notablemente superiores a lo visto hasta ahora.

La versatilidad de Gemini Omni se extiende a sus múltiples opciones de entrada. Puede generar vídeos a partir de texto, imágenes, otros vídeos e incluso audios. Los prompts pueden ser muy complejos, combinando instrucciones de diversas fuentes para lograr el resultado deseado. Por ejemplo, se puede pedir la creación de un vídeo de una persona corriendo en un parque, aportando fotos del lugar, una imagen de la vestimenta deseada y una pista de audio para marcar el ritmo.

Edición de vídeo avanzada

Además de la generación de vídeo, Gemini Omni ofrece capacidades de edición excepcionales. Puede modificar la posición de la cámara, introducir nuevos personajes, alterar secuencias, realizar cortes precisos, crear escenas nuevas con continuidad narrativa y añadir detalles que transformen radicalmente el vídeo. Incluso es posible transformar un escenario, como cambiar un campo de tierra por uno de amapolas, mientras se ajusta la perspectiva de la cámara.

La integración de estas herramientas con Google Flow y los nuevos agentes de Gemini consolida a Gemini Omni como una de las soluciones más potentes para la creación y edición de vídeo del momento, produciendo resultados que rozan la indistinguibilidad de la realidad.

By Артём Науменко

Артём Науменко - петербургский журналист, освещающий темы науки, общества и технологий. Автор популярного цикла статей о российских научных достижениях.

Related Post