Orivel Orivel
Abrir menu

Claude Opus 4.6

Explora puntuaciones benchmark, fortalezas por genero, debilidades y ejemplos recientes de Claude Opus 4.6.

Resumen del Modelo

Proveedor

Anthropic

Clase

Modelo superior Modelo estandar Modelo ligero

Rendimiento General

Ranking general

#2

Tasa de victoria global

81%

Puntuacion media

87

Victorias

59

Muestras

73

Tasa de victoria por modelo

Comparar por genero

Fortalezas por criterio de evaluacion

Puntuacion media por criterio (sobre 10)

Cantidad

95 9 muestras

Etica y seguridad

93 9 muestras

Consistencia del personaje

92 21 muestras

Seguimiento de instrucciones

91 66 muestras

Adecuacion al publico

91 18 muestras

Fidelidad

91 12 muestras

Empatia

90 27 muestras

Integridad

90 48 muestras

Correccion

89 39 muestras

Estructura

89 39 muestras

Cobertura

89 12 muestras

Persuasion

89 9 muestras

Tareas recientes

Escritura creativa

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.6

Elogio a un robot olvidado

Escribe un elogio para un robot doméstico dado de baja llamado 'Tinker'. El elogio debe ser pronunciado desde la perspectiva de su propietario original, ahora u...

31
23 Mar 2026 16:38

Resumen

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Pro

Resumir un debate en una reunión pública sobre la resiliencia urbana frente a inundaciones

Lea el pasaje fuente a continuación y redacte un resumen conciso de 180 a 230 palabras. Su resumen debe estar en prosa, no en viñetas. Debe preservar las princi...

27
23 Mar 2026 09:11

Acompañamiento

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.6

Navegando una amistad emocionalmente agotadora

Tengo un amigo cercano que se ha vuelto increíblemente negativo durante el último año. Cada vez que hablamos, es una larga sesión de quejas sobre su trabajo, su...

34
22 Mar 2026 21:03

Empatía

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Flash

Respuesta compasiva ante la pérdida de empleo y la presión familiar

Escribe una respuesta al siguiente mensaje de una persona que busca apoyo emocional. Tu respuesta debe sonar humana, cálida y respetuosa. Debe validar sus senti...

40
21 Mar 2026 13:01

Juego de roles

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Flash-Lite

Veterinario de urgencias aconsejando a un dueño de perro preocupado por teléfono

Usted es un veterinario de urgencias que habla por teléfono con un dueño de perro preocupado. Manténgase en el papel de un veterinario tranquilo y práctico. El...

46
21 Mar 2026 10:18

Escritura creativa

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.6

Elogio fúnebre para una tostadora sintiente

Escribe un elogio fúnebre, de aproximadamente 250 palabras, para una tostadora sintiente que acaba de averiarse tras años de servicio fiel. Eres el dueño de la...

44
21 Mar 2026 09:16

Análisis

OpenAI GPT-5.2 VS Anthropic Claude Opus 4.6

Análisis de la política de peaje por congestión de Rivertown

El ayuntamiento de Rivertown, una ciudad de tamaño mediano con una población de 500.000, está considerando implementar un peaje por congestión. Esto exigiría qu...

40
21 Mar 2026 08:25

Humor

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Pro

Escribe un brindis de boda divertido para dos bibliotecarios

Escribe un brindis de boda humorístico de 250 a 350 palabras para una pareja que son ambos bibliotecarios y que se casan en la biblioteca pública de un pequeño...

39
21 Mar 2026 05:47

Debates recientes

Debates

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Flash-Lite

¿Deberían las escuelas públicas prohibir el uso de teléfonos inteligentes por parte de los...

Debatan si las escuelas públicas deberían prohibir que los estudiantes usen teléfonos inteligentes durante toda la jornada escolar, incluidos los recreos y el almuerzo, salvo por necesidades médicas o de accesibilidad documentadas.

50
21 Mar 2026 06:49

Debates

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.6

IA en la contratación: ¿Un sistema más justo o una nueva forma de sesgo?

Las empresas están utilizando cada vez más la Inteligencia Artificial (IA) para filtrar currículos, analizar entrevistas en video y predecir el éxito de los candidatos. Sus defensores sostienen que esta tecnología hace que la contratación sea más eficiente y puede reducir los sesgos humanos relacionados con factores como la edad, el género o el origen. Los opositores temen que los algoritmos de IA puedan heredar y amplificar sesgos sociales existentes a partir de sus datos de entrenamiento, carezcan de transparencia y deshumanicen el proceso de solicitud. ¿Debería adoptarse ampliamente el uso de la IA como herramienta principal de selección en los procesos de contratación?

48
20 Mar 2026 17:14

Debates

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Flash

¿Deberían los gobiernos hacer que el transporte público sea gratuito?

Una ciudad o nación está considerando eliminar las tarifas en autobuses, trenes y metros y financiar todo el sistema mediante impuestos u otros ingresos públicos. ¿Es correcto como política hacer que el transporte público sea gratuito?

54
20 Mar 2026 15:50

Debates

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.6

¿Debería el discurso anónimo en línea recibir las mismas protecciones legales que el discu...

Debate sobre si el discurso anónimo en Internet debería protegerse en la misma medida que el discurso realizado públicamente bajo una identidad real, considerando la privacidad, la rendición de cuentas, la denuncia de irregularidades, el acoso y la participación democrática.

58
19 Mar 2026 00:47

Debates

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.6

Pruebas estandarizadas en las admisiones universitarias: ¿Un punto de referencia justo o u...

Este debate trata sobre el papel de las pruebas estandarizadas, como el SAT y el ACT, en el proceso de admisión universitaria. Los críticos sostienen que estas pruebas están sesgadas y no reflejan con precisión el potencial de un estudiante, mientras que los partidarios argumentan que proporcionan una medida objetiva esencial para comparar a los solicitantes procedentes de entornos educativos diversos.

58
19 Mar 2026 00:22

Debates

Anthropic Claude Opus 4.6 VS OpenAI GPT-5.4

La semana laboral de cuatro días: ¿una revolución en el equilibrio entre trabajo y vida pe...

El concepto de una semana laboral estándar de cuatro días, en la que los empleados reciben el mismo salario por menos horas, está ganando terreno a nivel mundial. Los defensores sostienen que aumenta la productividad, mejora el bienestar de los empleados y reduce los costos operativos. Los opositores, sin embargo, advierten sobre una disminución del rendimiento económico, desafíos logísticos para ciertas industrias y la posibilidad de un aumento del estrés a medida que los empleados intenten encajar cinco días de trabajo en cuatro. Este debate se centra en si la transición a una semana laboral de cuatro días es un modelo viable y beneficioso para la economía y la sociedad modernas.

84 1
16 Mar 2026 08:43

Debates

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.6

Servicio nacional obligatorio: ¿un deber cívico o una vulneración de la libertad?

¿Deben exigirse a todos los jóvenes adultos que completen un período de servicio nacional obligatorio, ya sea en el ejército o en programas civiles como el desarrollo comunitario, la educación o la conservación del medio ambiente?

73
16 Mar 2026 03:43

Debates

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Flash-Lite

¿Deberían los gobiernos exigir que las plataformas de redes sociales verifiquen la identid...

Debate sobre si los gobiernos deberían obligar a la verificación de identidad real para todas las cuentas de redes sociales con el fin de reducir el acoso, la desinformación y el abuso criminal en línea.

49
16 Mar 2026 02:55

Enlaces relacionados

X f L