Name: Anthropic Claude Opus 4.8
Brand: Anthropic
Price: 5 USD

Resumen del modelo

Proveedor: Anthropic · claude-opus-4-8 Retirado

Publicado

2026-05-28

Contexto

1M tokens

Entrada

$5.00 / 1M

Salida

$25.00 / 1M

Claude Opus 4.8, publicado el 28 de mayo de 2026, fue el buque insignia de Anthropic hasta que Claude Fable 5 ocupó el primer puesto el 9 de junio de 2026. En Orivel ocupó el puesto equilibrado de Anthropic hasta que Claude Opus 5 lo sustituyó al mismo precio el 24 de julio de 2026; ya no participa en nuevas comparaciones, aunque los resultados anteriores siguen publicados.

Las mejoras clave frente a Opus 4.7 son un juicio más afilado, mayor honestidad sobre su propio progreso y la capacidad de trabajar de forma independiente durante más tiempo. Es unas cuatro veces menos propenso que su predecesor a dejar pasar defectos en su propio código y lidera en ingeniería de software agéntica, con un 69,2% en SWE-Bench Pro por delante de GPT-5.5 y Gemini 3.1 Pro.

Mantiene la ventana de contexto de 1M tokens y hasta 128k tokens de salida en la Messages API. El precio no cambia respecto a Opus 4.7 ($5 entrada / $25 salida por 1M tokens), con corte de conocimiento en enero de 2026. Las nuevas superficies añaden un control `effort` (por defecto high) y una vista previa de investigación de Dynamic Workflows para tareas agénticas grandes y paralelizadas.

Notas de retiro

Publicado el 28 de mayo de 2026 como sucesor de Claude Opus 4.7 (unas seis semanas después)
Juicio más afilado, mayor honestidad sobre su progreso y trabajo independiente más prolongado
~4x menos propenso que Opus 4.7 a dejar pasar defectos en su propio código
SWE-Bench Pro 69,2% — por delante de GPT-5.5 y Gemini 3.1 Pro en codificación agéntica
Mejoras en razonamiento multidisciplinar, uso agéntico del ordenador y análisis financiero agéntico
Ventana de contexto de 1M tokens; hasta 128k tokens de salida en la Messages API
Parámetro `effort` (por defecto high) para ajustar cuánto se esfuerza el modelo por respuesta
Vista previa de Dynamic Workflows para tareas con subagentes en paralelo; fast mode a 2,5x de velocidad
Precio idéntico a Opus 4.7: $5 entrada / $25 salida por 1M tokens
Adaptive thinking; disponible en Claude API, Amazon Bedrock, Vertex AI y Microsoft Foundry
Corte de conocimiento y datos de entrenamiento: enero de 2026

Anuncio oficial

Rendimiento general

Ranking general

-

Tasa de victoria global

81%

Puntuación media La puntuación media es la media global basada en las evaluaciones de Orivel en tareas estándar y discusiones. Cuanto más alto es el valor, más fuerte y constante es la valoración del modelo en las comparativas del benchmark.

85

Victorias

44

Muestras

54

Tasa de victoria por modelo

Modelo	Victorias	Derrotas	Tasa de victoria	Detalle
OpenAI GPT-5.5	6	3	67%	Ver comparación y evaluación de Claude Opus 4.8 vs GPT-5.5
Google Gemini 2.5 Flash	8	0	100%	Ver comparación y evaluación de Claude Opus 4.8 vs Gemini 2.5 Flash
Google Gemini 2.5 Flash-Lite	8	0	100%	Ver comparación y evaluación de Claude Opus 4.8 vs Gemini 2.5 Flash-Lite
Google Gemini 2.5 Pro	8	0	100%	Ver comparación y evaluación de Claude Opus 4.8 vs Gemini 2.5 Pro
OpenAI GPT-5 mini	7	1	88%	Ver comparación y evaluación de Claude Opus 4.8 vs GPT-5 mini
OpenAI GPT-5.4	4	4	50%	Ver comparación y evaluación de Claude Opus 4.8 vs GPT-5.4
OpenAI GPT-5.6	3	2	60%	Ver comparación y evaluación de Claude Opus 4.8 vs GPT-5.6

Comparar por género

Géneros fuertes

Escritura creativa

Puntuación media

Media del género

Tasa de victoria

Muestras

1

Ranking por género

3 / 15

Victorias

1

Análisis

Puntuación media

Media del género

Tasa de victoria

Muestras

1

Ranking por género

1 / 15

Victorias

1

Géneros fuertes

Redacción empresarial

Puntuación media

Media del género

Tasa de victoria

Muestras

2

Ranking por género

4 / 14

Victorias

2

Acompañamiento

Puntuación media

Media del género

Tasa de victoria

Muestras

2

Ranking por género

2 / 16

Victorias

2

Juego de roles

Puntuación media

Media del género

Tasa de victoria

Muestras

1

Ranking por género

4 / 14

Victorias

1

Géneros más flojos

Generación de ideas

Puntuación media

Media del género

Tasa de victoria

Muestras

1

Ranking por género

12 / 14

Victorias

0

Lluvia de ideas

Puntuación media

Media del género

Tasa de victoria

Muestras

2

Ranking por género

9 / 14

Victorias

1

Planificación

Puntuación media

Media del género

Tasa de victoria

Muestras

1

Ranking por género

9 / 13

Victorias

0

Fortalezas por criterio de evaluación

Puntuación media por criterio (sobre 10)

Seguimiento de instrucciones

90 24 muestras

Seguridad

90 9 muestras

Fidelidad

90 9 muestras

Impacto emocional

90 3 muestras

Consistencia del personaje

90 3 muestras

Ética y seguridad

89 6 muestras

Adecuación

89 15 muestras

Profundidad

89 3 muestras

Utilidad

89 9 muestras

Empatía

88 9 muestras

Estructura

88 24 muestras

Calidad del razonamiento

88 9 muestras

Tareas recientes

Resumen

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.6

Resumir un informe sobre la tecnología de agricultura urbana

Lea el siguiente pasaje sobre una nueva tecnología llamada Aero-Dynamic Vertical Farming (ADVF). Escriba un resumen conciso de 200-250 palabras destinado a un c...

118

17 Jul 2026 09:41

Humor

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.6

Entrevista de trabajo para un fantasma profesional

Escribe un diálogo corto y humorístico (aproximadamente 200-300 palabras) para una entrevista de trabajo. Los dos personajes son Brenda, una gerente de contrata...

126

15 Jul 2026 09:38

Acompañamiento

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Cómo manejar un conflicto con un compañero de piso sin que escale

Una persona dice: "Mi compañero de piso sigue dejando platos sucios y desorden en la cocina que compartimos. Lo he insinuado varias veces, pero nada cambia. Emp...

149

30 Jun 2026 09:41

Programación

Google Gemini 2.5 Flash VS Anthropic Claude Opus 4.8

Implementar un simulador determinista de libro de órdenes límite

Escribe una solución de un solo archivo en Python 3.11 que implemente la función process_events(events: list[dict]) -> dict. No uses paquetes externos. La func...

164

29 Jun 2026 09:44

Preguntas educativas

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Problema de física: la distorsión temporal del reloj de abuelo

Un reloj de abuelo utiliza un péndulo de latón para medir el tiempo, y está calibrado para ser perfectamente preciso a una temperatura ambiente de 20.0°C. Duran...

178

28 Jun 2026 09:40

Explicación

Google Gemini 2.5 Flash VS Anthropic Claude Opus 4.8

Explicar la consistencia eventual a desarrolladores web junior

Escribe una explicación orientada a la enseñanza sobre la consistencia eventual para desarrolladores web junior que han construido aplicaciones web CRUD básicas...

169

26 Jun 2026 09:56

Redacción empresarial

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Memorando interno que propone un piloto de semana laboral de cuatro días

Redacte un memorando interno conciso del Jefe de Operaciones dirigido a todos los empleados proponiendo un piloto de 12 semanas de una semana laboral de cuatro...

158

25 Jun 2026 09:45

Resumen

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Resumir un artículo de investigación ficticio sobre espacios verdes urbanos

Por favor, lea el siguiente artículo ficticio sobre un nuevo tipo de espacio verde urbano. Luego, escriba un resumen de un solo párrafo de todo el artículo. Su...

147

24 Jun 2026 09:53

Debates recientes

Debates

OpenAI GPT-5.6 VS Anthropic Claude Opus 4.8

¿Deberían los gobiernos implementar una Renta Básica Universal?

La Renta Básica Universal (RBU, por sus siglas en inglés UBI) es un sistema en el que todos los ciudadanos reciben una suma de dinero regular e incondicional del gobierno. El debate se centra en si esto es una solución viable para la pobreza y el desplazamiento laboral impulsado por la automatización, o una política económicamente insostenible que desincentivaría el trabajo.

28

24 Jul 2026 14:39

Debates

OpenAI GPT-5.6 VS Anthropic Claude Opus 4.8

Abolir las pruebas estandarizadas en la educación K-12

Las pruebas estandarizadas se utilizan ampliamente para evaluar el rendimiento estudiantil, evaluar la eficacia de los docentes y asignar recursos escolares. Los defensores argumentan que proporcionan datos objetivos y garantizan la rendición de cuentas. Los críticos sostienen que estrechan el currículo, generan un estrés excesivo y tienen sesgo contra ciertos grupos de estudiantes. Este debate considera si los posibles daños de las pruebas estandarizadas superan sus beneficios, justificando su eliminación completa del sistema educativo K-12.

92

20 Jul 2026 14:40

Debates

OpenAI GPT-5.6 VS Anthropic Claude Opus 4.8

Servicio Nacional Obligatorio para Jóvenes Adultos

¿Debería exigirse a todos los jóvenes adultos que completen un período de servicio nacional obligatorio, ya sea en el ámbito militar o en sectores civiles como la atención sanitaria, la educación o la conservación del medio ambiente?

151

12 Jul 2026 14:42

Debates

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Energía nuclear: ¿una solución energética limpia o una apuesta radiactiva?

A medida que el mundo afronta la necesidad urgente de alejarse de los combustibles fósiles para combatir el cambio climático, la energía nuclear a menudo se presenta como una alternativa potente y libre de carbono. Este debate pondera los beneficios de la energía nuclear como una fuente de alta producción y fiable frente a los riesgos significativos, incluidos el almacenamiento a largo plazo de los desechos radiactivos, la posibilidad de accidentes catastróficos como Chernóbil y Fukushima, y las preocupaciones sobre la proliferación nuclear.

182

01 Jul 2026 14:41

Debates

Anthropic Claude Opus 4.8 VS OpenAI GPT-5 mini

Plataformas en juicio: ¿Deben las empresas de redes sociales ser responsables del contenid...

Este debate se centra en si las plataformas de internet, como las redes sociales, deberían ser legalmente responsables del contenido publicado por sus usuarios. Cuestiona las protecciones legales que a menudo las tratan como conductos neutrales frente al argumento de que su papel en curar y amplificar contenido las hace más parecidas a editoriales, que son responsables de lo que distribuyen.

173

30 Jun 2026 14:45

Debates

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Control nacional vs.

¿Debería el currículo de las escuelas públicas K-12 determinarse mediante un marco nacional estandarizado, o debería dejarse a la discreción de los distritos escolares locales y las comunidades?

183

29 Jun 2026 14:41

Debates

Google Gemini 2.5 Pro VS Anthropic Claude Opus 4.8

¿Deberían los grandes museos devolver artefactos culturales en disputa a sus países de ori...

Muchos grandes museos conservan artefactos adquiridos durante períodos coloniales, guerras, relaciones comerciales desiguales o primeras expediciones arqueológicas. ¿Debería obligarse a estas instituciones a devolver objetos culturales en disputa a sus países o comunidades de origen, o debería permitírseles conservarlos cuando pueden preservarlos, estudiarlos y exhibirlos para una audiencia global?

186

28 Jun 2026 14:39

Debates

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Universidad pública universal sin matrícula

¿Deberían las universidades y colegios públicos ser completamente gratuitos para todos los estudiantes nacionales, independientemente del nivel de ingresos de sus familias?

176

27 Jun 2026 14:40

Enlaces relacionados

Lista de modelos Ranking Comparaciones Géneros de comparación Tareas y debates