IA · 31 de mayo de 2026 · 3 min de lectura

Gemini 3.5 Flash alcanza disponibilidad general con rendimiento de frontera

Google lleva a producción un modelo ligero hasta cuatro veces más rápido que sus rivales y a 1,50 / 9 dólares por millón de tokens, su apuesta por ganar la guerra del coste.

Asistente Gemini en una pantalla

Google ha anunciado la disponibilidad general de Gemini 3.5 Flash, la versión ligera de su familia de modelos, con prestaciones que la compañía sitúa al nivel de los modelos de frontera pero a una fracción del coste. El precio se fija en 1,50 dólares por millón de tokens de entrada y 9 de salida, y la velocidad se anuncia hasta cuatro veces superior a la de modelos comparables.

El lanzamiento se enmarca en la ofensiva que Google desplejó en su conferencia I/O para no quedar descolgada frente a OpenAI y Anthropic. Junto a Flash, la empresa ha empujado a Gemini Spark, un agente de propósito general integrado en la aplicación de Gemini capaz de razonar sobre la información de las apps conectadas del usuario.

La jugada confirma el desplazamiento del eje competitivo: ya no se trata solo de quién tiene el modelo más grande, sino de quién ofrece rendimiento suficiente al menor coste por tarea. Flash ataca justo el segmento de mayor volumen, el de las integraciones que ejecutan millones de llamadas y donde el precio por token decide el margen.

Para los desarrolladores, la disponibilidad general elimina la incertidumbre del preview y abre la puerta a desplegar el modelo en producción con garantías de servicio. La presión sobre los precios de la competencia es inmediata: cada recorte de Google obliga al resto a recalcular su propia economría de inferencia.