Anthropic presenta Claude Fable 5 y alcanza el 95 % en SWE-bench
El nuevo modelo de acceso general de Anthropic, de la clase «Mythos», logra un 95 % en SWE-bench Verified y se ofrece a 10 y 50 dólares por millón de tokens de entrada y salida.
Anthropic ha presentado Claude Fable 5, un modelo de acceso general de su nueva clase «Mythos» que alcanza un 95 % en SWE-bench Verified, el banco de pruebas de referencia para resolver incidencias reales de programación. El precio anunciado —10 dólares por millón de tokens de entrada y 50 de salida— lo coloca en la gama alta, pero acorde con su orientación a tareas complejas.
El 95 % en SWE-bench es la cifra que define el momento: hace dos años, los mejores modelos rondaban el 40-50 %. Resolver casi todas las incidencias de un banco de pruebas de ingeniería real significa que el modelo ya no asiste al programador, sino que ejecuta tareas completas de extremo a extremo. Es la base de los agentes de código que escriben, prueban y corrigen sin supervisión continua.
Fable 5 llega en plena ofensiva de Anthropic, que acaba de superar a OpenAI en valoración y prepara su salida a bolsa. Su tesis es clara: liderar en código y en uso empresarial, los dos terrenos donde la IA ya genera ingresos reales.
El 95 % en SWE-bench marca el punto en que el modelo deja de ser un copiloto para convertirse en un trabajador. La señal real no es el número, sino lo que habilita: agentes de código que cierran el ciclo entero —escribir, ejecutar, depurar— con mínima supervisión. El riesgo es la confianza ciega: un modelo que acierta el 95 % falla el 5 %, y en ingeniería ese 5 % puede ser catastrófico si nadie revisa. Anthropic apuesta por el terreno donde la IA ya se monetiza —el código y la empresa—, y por eso vale casi un billón. La pregunta abierta es si la fiabilidad crece tan rápido como la capacidad, o si seguimos delegando más de lo que conviene.