Чт. Мар 5th, 2026

Google представила Gemini 3.1 Flash-Lite: самый быстрый и доступный ИИ на сегодняшний день

Изображение Google Gemini 3.1 Flash-Lite

Google официально представила Gemini 3.1 Flash-Lite — оптимизированную версию своей модели, которую большинство пользователей уже используют в приложении Gemini. Этот новый ИИ позиционируется как самый быстрый и доступный вариант в линейке, демонстрируя производительность на уровне других крупных моделей. Версия уже доступна для предварительного ознакомления и скоро будет выпущена для разработчиков.

Согласно официальной публикации в блоге компании, Gemini 3.1 Flash-Lite разработан для обработки огромных объемов данных, при этом избавляя разработчиков от беспокойства о высоких затратах. Модель превосходит версию 2.5 Flash, обеспечивая время ответа до 2,5 раз быстрее. Сокращение задержки не влияет на качество ответов; они остаются на том же уровне или даже улучшаются в некоторых сценариях.

Данные о производительности показывают, что Gemini 3.1 Flash-Lite набрал 1432 балла Elo в рейтинге Arena.ai. В технических тестах модель достигает 86,9% в GPQA Diamond и 76,8% в MMMU Pro. GPQA Diamond измеряет способности глубокого рассуждения при ответах на вопросы экспертного уровня, тогда как MMMU Pro оценивает, как модели одновременно обрабатывают текст и изображения в междисциплинарных задачах.

Таблица сравнения производительности Gemini 3.1 Flash-Lite с другими моделями

По сравнению с GPT-5 mini, Claude 4.5 Haiku или Grok 4.1 Flash, Gemini 3.1 Flash-Lite превосходно показывает себя в тестах на научные знания, понимание видео и многоязычное рассуждение. Результаты также демонстрируют, что, будучи урезанной версией, она сохраняет способность к рассуждению, превосходящую некоторые более крупные модели.

Одной из функций, унаследованных от старших моделей, является контроль над «уровнями мышления». Это позволяет разработчикам определять, сколько вычислительных ресурсов модель будет затрачивать на каждую задачу. Запрос на создание сложного пользовательского интерфейса требует иного подхода, чем простой перевод, что позволяет оптимизировать операционные расходы.

Gemini 3.1 Flash-Lite: не хуже старших братьев

Разница между оригинальной Gemini 3 Flash и новой версией 3.1 Flash-Lite наиболее заметна в ценовой политике. Предшественник был выпущен по цене $0,50 за миллион входных токенов и $3 за миллион выходных. В версии Lite Google снизила эти цены ровно вдвое: до $0,25 за вход и $1,50 за выход.

График сравнения скорости и стоимости Gemini Flash-Lite

Что касается скорости, улучшение заметно и измеримо. Согласно тестам Artificial Analysis, 3.1 Flash-Lite генерирует ответы на 45% быстрее, чем Gemini 2.5 Flash. Если сравнить его со стандартным Gemini 3 Flash, который уже был втрое быстрее серии 2.5 Pro, становится очевидным стремление Google уменьшить трудности для разработчиков, которым требуются мгновенные ответы.

Однако в области программирования Gemini 3.1 Flash-Lite показывает себя менее сильной стороной. В тестах LiveCodeBench ИИ от Google не смог превзойти GPT-5 mini и Grok 4.1 Fast. Новая версия ориентирована на выполнение сложных инструкций в повторяющихся процессах, поэтому, если вы ищете эксперта по написанию кода, эта модель не для вас.

Gemini 3.1 Flash-Lite будет доступен в предварительной версии через API в Google AI Studio, а для корпоративных клиентов — через Vertex AI. Стоит отметить, что эта модель предназначена для разработчиков, в то время как Gemini 3.1 Flash является более сбалансированной версией, ориентированной на конечных потребителей.

By Артём Науменко

Артём Науменко - петербургский журналист, освещающий темы науки, общества и технологий. Автор популярного цикла статей о российских научных достижениях.

Related Post