Claude Opus 4.7
Explora puntuaciones benchmark, fortalezas por genero, debilidades y ejemplos recientes de Claude Opus 4.7.
Resumen del Modelo
Publicado
2026-04-16
Contexto
1M tokens
Entrada
$5.00 / 1M
Salida
$25.00 / 1M
Claude Opus 4.7 es el modelo insignia actual de Anthropic, con disponibilidad general desde el 16 de abril de 2026. Anthropic lo posiciona como su modelo más capaz para razonamiento complejo, trabajo agéntico de largo recorrido e ingeniería de software de frontera.
El cambio más notable respecto a Opus 4.6 es un salto cualitativo en codificación agéntica: ahora se le puede confiar el trabajo de programación más difícil. La visión mejora de forma sustancial, con entrada de imágenes de alta resolución, y los resultados creativos (interfaces, presentaciones, documentos) llegan con mejor gusto y pulido.
Incorpora un nuevo tokenizador, ventana de contexto de 1M tokens, hasta 128k tokens de salida en la Messages API y Adaptive thinking, que decide cuándo razonar en profundidad. El precio se mantiene igual que Opus 4.6 ($5 entrada / $25 salida por 1M tokens) y el corte de conocimiento es enero de 2026.
Cambios
- Salto cualitativo en codificación agéntica — más fuerte en trabajos de ingeniería de software de largo recorrido y múltiples archivos
- Visión notablemente mejor con entrada de imágenes de alta resolución
- Mejor gusto en salidas creativas: interfaces, presentaciones, documentos
- Nuevo tokenizador; contexto de 1M tokens y hasta 128k tokens de salida en Messages API
- Hasta 300k tokens de salida en Message Batches API mediante la cabecera beta `output-300k-2026-03-24`
- Adaptive thinking: el modelo decide cuándo razonar paso a paso
- Precio idéntico a Opus 4.6: $5 entrada / $25 salida por 1M tokens
- Disponible en Claude API, Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry
- Corte de conocimiento y datos de entrenamiento: enero de 2026
Rendimiento General
Ranking general
#1
Tasa de victoria global
Puntuacion media
Victorias
19
Muestras
21
Tasa de victoria por modelo
| Modelo | Victorias | Derrotas | Empates | Tasa de victoria | Detalle |
|---|---|---|---|---|---|
| OpenAI GPT-5.2 | 4 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Claude Opus 4.7 vs GPT-5.2 |
| OpenAI GPT-5 mini | 3 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Claude Opus 4.7 vs GPT-5 mini |
| Google Gemini 2.5 Flash | 3 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Claude Opus 4.7 vs Gemini 2.5 Flash |
| Google Gemini 2.5 Flash-Lite | 3 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Claude Opus 4.7 vs Gemini 2.5 Flash-Lite |
| Google Gemini 2.5 Pro | 3 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Claude Opus 4.7 vs Gemini 2.5 Pro |
| OpenAI GPT-5.4 | 1 | 2 | 0 |
33%
|
Ver comparacion y evaluacion de Claude Opus 4.7 vs GPT-5.4 |
| OpenAI GPT-5.5 | 2 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Claude Opus 4.7 vs GPT-5.5 |
Comparar por genero
Generos fuertes
Planificación
Puntuacion media
Genre Average
Tasa de victoria
Muestras
1
Ranking por genero
1 / 10
Victorias
1
Preguntas educativas
Puntuacion media
Genre Average
Tasa de victoria
Muestras
1
Ranking por genero
1 / 10
Victorias
1
Escritura creativa
Puntuacion media
Genre Average
Tasa de victoria
Muestras
1
Ranking por genero
2 / 10
Victorias
1
Juego de roles
Puntuacion media
Genre Average
Tasa de victoria
Muestras
2
Ranking por genero
2 / 11
Victorias
2
Debate
Puntuacion media
Genre Average
Tasa de victoria
Muestras
10
Ranking por genero
2 / 11
Victorias
9
Fortalezas por criterio de evaluacion
Puntuacion media por criterio (sobre 10)
Empatia
Seguridad
Consistencia del personaje
Calidad del estilo
Especificidad
Priorizacion
Adecuacion al publico
Fidelidad
Calidad del razonamiento
Seguimiento de instrucciones
Adecuacion
Viabilidad
Tareas recientes
Juego de roles
Consejos de un detective noir sobre ser seguido
Eres el Detective Miles Corrigan, un investigador privado sacado de una película noir de la década de 1940. Tu oficina está débilmente iluminada, con olor a caf...
Preguntas educativas
Analizar por qué un producto no es un polinomio
Un estudiante afirma que, dado que f(x) = (x^2 - 1)/(x - 1) se simplifica a x + 1 para x ≠ 1, la función g(x) = ((x^2 - 1)/(x - 1)) · |x - 1| es un polinomio ig...
Empatía
Responder a un amigo abrumado por el cuidado y el trabajo
Un amigo te envía este mensaje: "Siento que estoy fracasando en todo. La salud de mi padre ha empeorado, estoy incumpliendo plazos en el trabajo, y cada vez que...
Programación
Convertidor de un subconjunto de Markdown a HTML
Escribe una función en Python `markdown_to_html(markdown_text: str) -> str` que convierta una cadena que contiene un subconjunto específico de Markdown en su re...
Acompañamiento
Sentirse solo después de una mudanza
Me mudé a una nueva ciudad por trabajo hace aproximadamente dos meses. Pensé que estaría emocionado, pero sinceramente, me siento realmente solo. No conozco a n...
Resumen
Resumir una audiencia del Concejo Municipal sobre un Plan de Resiliencia al Calor
Lee el siguiente pasaje fuente y escribe un resumen conciso del mismo de 180 a 230 palabras. Tu resumen debe tener un tono neutral, estar escrito como un único...
Persuasión
Persuadir a un concejo municipal escéptico para implementar un programa piloto de calles escolares sin coches
Escriba un discurso persuasivo dirigido a un consejo municipal que está decidiendo si aprobar un programa piloto de seis meses para crear zonas sin coches en la...
Planificación
Plan de acción para el Día de Limpieza del Vecindario
Crea un plan de acción integral para organizar un día de limpieza del vecindario. El plan debe ser una guía paso a paso para tu pequeño equipo de organizadores,...
Debates recientes
Debates
Renta Básica Universal (RBU)
¿Deben los gobiernos implementar una Renta Básica Universal (RBU), proporcionando una suma regular e incondicional de dinero a todos los ciudadanos independientemente de su situación laboral?
Debates
La economía de los 'gigs': ¿empoderamiento o explotación?
El auge de las plataformas basadas en aplicaciones para el trabajo freelance, como los servicios de transporte compartido y de reparto, ha creado una gran 'gig economy'. Este modelo ofrece flexibilidad a los trabajadores y comodidad a los consumidores, pero también plantea preguntas importantes sobre los derechos de los trabajadores, la seguridad laboral y la estabilidad económica. ¿Debería fomentarse este modelo de trabajo como el futuro del empleo, o debería regularse estrictamente para proporcionar las protecciones laborales tradicionales?
Debates
¿Deberían los gobiernos exigir a las plataformas de redes sociales que verifiquen la ident...
Debate sobre si los gobiernos deberían exigir la verificación de identidad real para todas las cuentas de redes sociales con el fin de reducir el acoso, el fraude y la desinformación.
Debates
La semana laboral de cuatro días: ¿progreso o problema?
La propuesta de estandarizar una semana laboral de cuatro días, a menudo con la misma remuneración que una semana de cinco días, está ganando atención a nivel mundial. Sus defensores afirman que aumenta la productividad, mejora la salud mental y física de los empleados y reduce los costos operativos. Sin embargo, los críticos sostienen que dicho modelo no es aplicable universalmente en todas las industrias, podría provocar un aumento del estrés al obligar a los empleados a concentrar más trabajo en menos días y puede afectar negativamente al servicio al cliente y a la continuidad del negocio. Este debate se centra en si la semana laboral de cuatro días es una evolución visionaria del trabajo o un ideal impracticable con importantes retos económicos y logísticos.
Debates
El futuro de la oficina: ¿Debería el trabajo remoto ser la opción predeterminada?
El cambio global hacia el trabajo remoto ha provocado un debate fundamental sobre el lugar de trabajo ideal. Los partidarios sostienen que convertir el trabajo remoto en la opción predeterminada ofrece una flexibilidad sin igual, mejora el equilibrio entre la vida laboral y personal y permite a las empresas acceder a un grupo de talento global mientras reduce los costos generales. Los opositores sostienen que una oficina física es esencial para fomentar la colaboración espontánea, construir una cultura empresarial sólida y la mentoría de empleados junior. La discusión se centra en si los beneficios del trabajo remoto superan la posible pérdida de interacción presencial y su impacto en la innovación y la cohesión del equipo.
Debates
¿Deberían las escuelas prohibir que los estudiantes usen IA generativa en tareas calificad...
Debatir si las escuelas primarias y secundarias deberían prohibir el uso de herramientas de IA generativa por parte de los estudiantes en tareas y ensayos calificados, excepto en casos de accesibilidad definidos de forma estrecha.
Debates
El estándar de la semana laboral de cuatro días
Esta discusión explora la propuesta de hacer que la semana laboral de cuatro días sea el estándar para el empleo a tiempo completo, sin reducción de salario. Los partidarios sostienen que aumenta la productividad, mejora el bienestar de los empleados y beneficia a la economía. Los opositores plantean dudas sobre su viabilidad en todas las industrias, el potencial aumento del estrés por tener que concentrar el trabajo en menos días y los impactos negativos en el servicio al cliente y en las operaciones empresariales.
Debates
¿Deberían los gobiernos exigir a las plataformas de redes sociales que verifiquen la ident...
Debatir si los gobiernos deberían exigir la verificación de identidad real para cada cuenta en las redes sociales, incluso si las plataformas siguen permitiendo seudónimos públicos.