Сб. Апр 18th, 2026

Microsoft presenta una IA de generación de imágenes un 40% más rápida que Gemini

Microsoft ha introducido una versión mejorada de su tecnología de inteligencia artificial para la creación de imágenes. Bajo el nombre de MAI-Image-2-Efficient, esta nueva iteración del modelo MAI-Image-2 promete un rendimiento superior con una reducción significativa en los costos. Según los informes, esta IA es capaz de generar imágenes hasta un 40% más rápido que Gemini.

La publicación en el blog oficial de Microsoft detalla que MAI-Image-2-Efficient ha sido diseñada para tres aplicaciones principales: la generación de imágenes en grandes volúmenes, la interacción fluida en conversaciones en tiempo real y la aceleración del prototipado. Para campañas publicitarias o catálogos extensos, la capacidad de producir miles de imágenes de manera eficiente es crucial. En el ámbito conversacional, la rapidez en la generación de imágenes mantiene la naturalidad del diálogo, mientras que en el prototipado, la prioridad es la velocidad sobre el nivel de detalle.

En cuanto a su desempeño, MAI-Image-2-Efficient demuestra ser más veloz que sus competidores directos. Al compararlo con Gemini 3.1 Flash, Gemini 3.1 Flash Image y Gemini 3 Pro Image, el modelo de Microsoft ofrece una ventaja de hasta el 40% en velocidad. En relación con su predecesor, MAI-Image-2, la nueva versión reduce el tiempo de generación de imágenes en un 22% y es hasta cuatro veces más eficiente, considerando la latencia y el consumo de GPU en una NVIDIA H100.

Es importante destacar que la versión Efficient no sustituye completamente a MAI-Image-2. El modelo estándar sigue siendo preferible cuando se requiere la inclusión de texto legible dentro de la imagen o cuando el fotorrealismo es la máxima prioridad. Aunque MAI-Image-2-Efficient puede no alcanzar el mismo nivel de contraste y profundidad tonal, ofrece imágenes más nítidas y con contornos más definidos, haciéndolo ideal para ilustraciones.

«MAI-Image-2-Efficient permite a su equipo probar rápidamente y de forma económica nuevos flujos de trabajo, experimentar con ideas creativas o refinar sus instrucciones», señaló Microsoft. «Su eficiencia superior se traduce en lotes de producción más grandes con un menor costo de GPU, lo que permite a su equipo pensar e iterar tan rápido como desee y llegar al producto final con mayor celeridad».

Esta mejora en eficiencia se refleja directamente en una reducción de precios. El costo por millón de tokens de salida para la generación de imágenes desciende de 33 dólares a 19,50 dólares, mientras que el precio de los tokens de entrada de texto se mantiene en 5 dólares por millón de tokens.

El lanzamiento de MAI-Image-2-Efficient se produce poco después de que Microsoft presentara otros modelos de su equipo de superinteligencia, como MAI-Image-2, MAI-Voice-1 y MAI-Transcribe-1. A pesar de la intensa competencia, la versión estándar de MAI-Image-2 se posicionó en el Top 5 de modelos de texto a imagen en arena.ai, solo por detrás de Gemini 3.1 Pro, GPT-Image 1.5 y Gemini 3.1 Flash.

Microsoft ha confirmado que MAI-Image-2-Efficient estará disponible para vista previa pública a partir de hoy a través de Microsoft Foundry y MAI Playground. La compañía ha anticipado que se compartirán más detalles sobre esta familia de modelos durante su conferencia Build 2026.

By Артём Науменко

Артём Науменко - петербургский журналист, освещающий темы науки, общества и технологий. Автор популярного цикла статей о российских научных достижениях.

Related Post