
Microsoft ha lanzado una versión mejorada de su herramienta de inteligencia artificial para la generación de imágenes. Se trata de MAI-Image-2-Efficient, una optimización del modelo MAI-Image-2 presentado recientemente, que promete un rendimiento superior a un coste considerablemente menor. Según los datos, esta nueva IA supera a Gemini en velocidad hasta en un 40%.
Esta versión optimizada está diseñada para tres aplicaciones principales: producción a gran escala, diálogos en tiempo real y desarrollo de prototipos. En escenarios de producción masiva, como campañas publicitarias o catálogos digitales, permite generar miles de imágenes de forma eficiente. Para las interacciones conversacionales, la generación rápida de imágenes mantiene la fluidez de la comunicación. En el desarrollo de prototipos, la prioridad es la velocidad, incluso si se sacrifica cierto nivel de detalle.
En cuanto a su desempeño, MAI-Image-2-Efficient demuestra ser más rápida que sus competidores directos. Al compararla con versiones de Gemini (3.1 Flash, 3.1 Flash Image y 3 Pro Image), el modelo de Microsoft ofrece una ventaja de hasta el 40% en velocidad. Comparado con su predecesor, MAI-Image-2, la mejora en tiempo de generación es del 22%, y es hasta cuatro veces más eficiente en términos de rendimiento por latencia y consumo de GPU (utilizando una NVIDIA H100).

MAI-Image-2-Efficient supera a Gemini en velocidad de generación de imágenes en un 40%
Microsoft aclara que la versión Efficient no reemplaza completamente al modelo MAI-Image-2 estándar. El modelo original sigue siendo preferible cuando se necesita integrar texto legible dentro de la imagen o cuando el fotorrealismo es la principal exigencia. Aunque Efficient puede no alcanzar la misma riqueza en contraste y profundidad tonal, produce imágenes con mayor nitidez y líneas más definidas, ideales para ilustraciones.
«MAI-Image-2-Efficient permite a su equipo probar rápidamente y de forma económica nuevos flujos de trabajo, experimentar con ideas creativas o refinar las indicaciones», comunicó Microsoft. «Su eficiencia superior se traduce en lotes de imágenes más grandes con un menor coste de GPU, permitiendo a su equipo pensar e iterar tan rápido como desee, llegando al producto final con mayor celeridad».

Esta mayor eficiencia se refleja directamente en una reducción de costes. El precio por millón de tokens de salida de imagen ha disminuido de 33 dólares a 19,50 dólares, mientras que el coste para el texto de entrada se mantiene en 5 dólares por millón de tokens.
El lanzamiento de MAI-Image-2-Efficient se produce poco después de que Microsoft presentara MAI-Image-2, MAI-Voice-1 y MAI-Transcribe-1, sus primeros modelos desarrollados por su equipo de superinteligencia. A pesar de la intensa competencia en el sector, el modelo estándar MAI-Image-2 logró posicionarse entre los cinco mejores modelos de texto a imagen en arena.ai, solo por detrás de Gemini 3.1 Pro, GPT-Image 1.5 y Gemini 3.1 Flash.
Microsoft ha confirmado que MAI-Image-2-Efficient estará disponible a partir de hoy como vista previa pública en Microsoft Foundry y MAI Playground. La compañía ha anunciado que habrá más novedades sobre esta familia de modelos durante su conferencia Build 2026.

