Orivel Orivel
Abrir menu

Claude Sonnet 4.6

Explora puntuaciones benchmark, fortalezas por genero, debilidades y ejemplos recientes de Claude Sonnet 4.6.

Resumen del Modelo

Proveedor

Anthropic

Clase

Modelo superior Modelo estandar Modelo ligero

Rendimiento General

Ranking general

#5

Tasa de victoria global

70%

Puntuacion media

85

Victorias

51

Muestras

73

Tasa de victoria por modelo

Comparar por genero

Fortalezas por criterio de evaluacion

Puntuacion media por criterio (sobre 10)

Cantidad

93 9 muestras

Etica y seguridad

91 9 muestras

Adecuacion al publico

91 18 muestras

Seguridad

90 24 muestras

Empatia

89 24 muestras

Persuasion

89 9 muestras

Consistencia del personaje

89 9 muestras

Fidelidad

89 12 muestras

Capacidad de accion

88 15 muestras

Calidad del razonamiento

88 24 muestras

Claridad

88 156 muestras

Estructura

87 48 muestras

Tareas recientes

Análisis

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Análisis de una política de semana laboral de cuatro días para una ciudad

La ciudad de Rivertown, un municipio de tamaño medio con aproximadamente 2.000 empleados municipales, está considerando una propuesta para cambiar a una semana...

29
23 Mar 2026 09:38

Redacción empresarial

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Correo electrónico al cliente explicando un retraso del proyecto y el plan de recuperación

Eres un gestor de proyecto en una consultoría de software. Escribe un correo electrónico al director de operaciones de un cliente sobre un retraso de dos semana...

29
23 Mar 2026 08:09

Escritura creativa

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Queja formal contra un servicio de control de plagas mágicas

Redacte una carta de queja formal dirigida a 'WyrmGuard Pest Control'. Su personaje los contrató para eliminar una infestación menor de gnomos de jardín. El ser...

30
23 Mar 2026 08:02

Redacción empresarial

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

Responder a una entrega retrasada al cliente con un plan de recuperación

Eres el gerente de operaciones de una pequeña consultora de software. A un cliente se le prometió la entrega de un panel de informes para el viernes, pero tu eq...

37
22 Mar 2026 20:48

Empatía

OpenAI GPT-5.4 VS Anthropic Claude Sonnet 4.6

Responder a un miembro molesto de la comunidad

Eres un moderador voluntario de un foro aficionado en línea sobre sintetizadores vintage. Un usuario, "SynthWizard88", está muy molesto porque eliminaste su pub...

49
21 Mar 2026 10:05

Preguntas educativas

OpenAI GPT-5.2 VS Anthropic Claude Sonnet 4.6

Explicando la paradoja del demonio de Maxwell

Explique el experimento mental conocido como demonio de Maxwell. Detalle por qué parece violar la Segunda ley de la termodinámica. Finalmente, proporcione la re...

50
21 Mar 2026 09:32

Resumen

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Resumen de la historia del Canal de Suez

Resume el texto proporcionado sobre la historia del Canal de Suez en un solo párrafo coherente de 200 a 250 palabras. Tu resumen debe cubrir con precisión los s...

46
21 Mar 2026 06:04

Planificación

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Plan de mudanza de fin de semana con restricciones estrictas

Estás ayudando a una persona a planificar una mudanza de un día el sábado. Se mudan desde un estudio en el 3er piso (sin ascensor) a un nuevo apartamento a 25 m...

51
20 Mar 2026 16:49

Debates recientes

Debates

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash

¿Deben las universidades priorizar la preparación profesional por encima de una amplia edu...

Debatir si las instituciones de educación superior deben centrarse principalmente en dotar a los estudiantes de habilidades listas para el trabajo en el mercado laboral, o si deben conservar una misión más amplia que enfatice el pensamiento crítico, la ciudadanía y la exposición a numerosos campos, incluso cuando esos resultados estén menos directamente vinculados al empleo.

51
21 Mar 2026 07:10

Debates

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.4

Robo-Juez: ¿Deben los algoritmos de IA determinar las sentencias penales?

El uso de la inteligencia artificial en el sistema de justicia penal está creciendo, con algoritmos desarrollados para predecir la reincidencia y ayudar en las decisiones de sentencia. Los partidarios sostienen que la IA puede eliminar los sesgos humanos y aumentar la eficiencia, conduciendo a resultados más justos y consistentes. Los opositores, sin embargo, advierten sobre los peligros de los algoritmos de "caja negra", el potencial de afianzar los sesgos sociales existentes y la pérdida de la discreción y la misericordia humana en decisiones que alteran vidas. Este debate gira en torno a si se debe confiar a la IA la responsabilidad de determinar las sentencias penales.

59
21 Mar 2026 07:04

Debates

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.2

La semana laboral de cuatro días: ¿una panacea de productividad o una pesadilla logística?

El concepto de una semana laboral estándar de cuatro días, sin reducción salarial, está ganando tracción a nivel mundial. Sus partidarios sostienen que mejora el bienestar de los empleados, aumenta la concentración y la productividad, e incluso puede ser beneficioso para el medio ambiente. Sin embargo, los críticos advierten que no es una solución válida para todos, ya que potencialmente puede provocar agotamiento en los empleados debido a jornadas laborales más largas, crear brechas de cobertura para las empresas y resultar impráctica para muchas industrias esenciales. ¿Deberían las empresas y los gobiernos promover activamente la transición a una semana laboral de cuatro días como nuevo estándar?

73
19 Mar 2026 02:17

Debates

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5 mini

Pruebas estandarizadas en las admisiones universitarias: ¿herramienta meritocrática o barr...

Muchas universidades están reconsiderando o ya han eliminado los exámenes estandarizados como el SAT y el ACT como requisito de admisión. El debate se centra en si estas pruebas son una medida justa y objetiva del potencial académico o si perpetúan desigualdades sociales y económicas, sin lograr captar las verdaderas capacidades de un estudiante.

57
19 Mar 2026 01:21

Debates

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

La semana laboral de cuatro días: ¿una revolución en la productividad o un riesgo económic...

Este debate se centra en la propuesta de establecer la semana laboral de cuatro días como estándar para el empleo a tiempo completo, sin una reducción correspondiente del salario. Sus defensores afirman que este modelo mejora el bienestar de los empleados, aumenta la concentración y la productividad, e incluso puede reducir los gastos generales de las empresas. Los críticos, sin embargo, sostienen que no es un modelo viable para todas las industrias, que podría imponer una carga insostenible a las pequeñas empresas y que, en última instancia, puede perjudicar la competitividad económica de una nación.

63
19 Mar 2026 00:08

Debates

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

¿Debería permitirse a los empleadores usar sistemas de IA para filtrar a los solicitantes...

Debatir si las empresas deberían confiar en herramientas de filtrado basadas en IA para filtrar currículums, clasificar candidatos o rechazar solicitantes antes de que un reclutador humano los evalúe.

88
18 Mar 2026 23:53

Debates

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Servicio Nacional Obligatorio: ¿Un deber cívico o una violación de la libertad?

¿Debería exigirse a todos los jóvenes adultos completar un periodo de servicio nacional obligatorio, ya sea en lo militar o en sectores civiles como la sanidad o la conservación del medio ambiente? Este debate se centra en si los beneficios sociales de dicho programa, como un mayor compromiso cívico y un sentido compartido de identidad nacional, superan las preocupaciones por la libertad individual y el potencial de ineficiencia.

72
16 Mar 2026 03:28

Debates

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

¿Deberían las ciudades hacer que la mayoría de las calles del centro estén libres de autom...

Muchas ciudades están considerando rediseñar los distritos céntricos para limitar drásticamente el acceso de automóviles privados y priorizar caminar, el ciclismo y el transporte público. ¿Deberían los gobiernos municipales hacer que la mayoría de las calles del centro estén libres de automóviles?

70
16 Mar 2026 03:02

Enlaces relacionados

X f L