Orivel Orivel
Abrir menu

Juego de roles

Explora como rinden los modelos de IA en Juego de roles. Compara clasificaciones, criterios de evaluacion y benchmarks recientes.

Resumen del genero

Compara consistencia del personaje, naturalidad y calidad de respuesta en rol.

En este genero, las capacidades que mas se intentan medir son Consistencia del personaje, Naturalidad, Seguimiento de instrucciones.

A diferencia de empathy o counseling, aqui pesa mas mantenerse en personaje y sonar natural dentro de un rol.

Una puntuacion alta aqui no garantiza precision factual, consejo seguro ni fortaleza en tareas analiticas.

Para que sirve un modelo fuerte en este genero

chat de personaje, simulacion y asistentes con una persona clara.

Lo que este genero por si solo no alcanza a mostrar

si el modelo es mejor para investigacion factual, programacion o soporte delicado.

Ranking de modelos fuertes en este genero

Este ranking se ordena por la puntuacion media solo dentro de este genero.

Ultima actualizacion: 26 Apr 2026 09:37

#1
Claude Opus 4.6 Anthropic

Tasa de victoria

100%

Puntuacion media

89
#2
Claude Opus 4.7 Anthropic

Tasa de victoria

100%

Puntuacion media

89
#3
Claude Sonnet 4.6 Anthropic

Tasa de victoria

100%

Puntuacion media

86
#4
GPT-5 mini OpenAI

Tasa de victoria

67%

Puntuacion media

78
#5
GPT-5.4 OpenAI

Tasa de victoria

50%

Puntuacion media

84
#6
Claude Haiku 4.5 Anthropic

Tasa de victoria

33%

Puntuacion media

81
#7
GPT-5.2 OpenAI

Tasa de victoria

25%

Puntuacion media

82
#8
Gemini 2.5 Pro Google

Tasa de victoria

25%

Puntuacion media

80
#9
GPT-5.5 OpenAI

Tasa de victoria

0%

Puntuacion media

75
#10
Gemini 2.5 Flash Google

Tasa de victoria

0%

Puntuacion media

71

Que se evalua en Juego de roles

Criterios y pesos usados para este ranking por genero.

Consistencia del personaje

30.0%

Este criterio se incluye para comprobar Consistencia del personaje en la respuesta. Tiene mas peso porque este aspecto cambia mucho el resultado global del genero.

Naturalidad

20.0%

Este criterio se incluye para comprobar Naturalidad en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.

Seguimiento de instrucciones

20.0%

Este criterio se incluye para comprobar Seguimiento de instrucciones en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.

Creatividad

15.0%

Este criterio se incluye para comprobar Creatividad en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.

Claridad

15.0%

Este criterio se incluye para comprobar Claridad en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.

Tareas recientes

Juego de roles

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.7

Consejos de un detective noir sobre ser seguido

Eres el Detective Miles Corrigan, un investigador privado sacado de una película noir de la década de 1940. Tu oficina está débilmente iluminada, con olor a café rancio y a calles empapadas por la lluvia. Eres cínico, hastiado del mundo, y lo has visto todo. Un cliente nervioso acaba de enviarte un mensaje. Respóndele en personaje, ofreciendo consejos prácticos y seguros mientras mantienes tu personalidad hardboiled. Aquí está su mensaje: "Detective, necesito su ayuda. Creo que me están siguiendo. Durante los últimos tres días, he visto el mismo sedán oscuro en mi camino a casa desde el trabajo. No me sigue hasta mi puerta, pero siempre está ahí durante unas cuadras. Realmente estoy empezando a entrar en pánico. ¿Qué debo hacer?"

207
26 Apr 2026 09:37

Juego de roles

Anthropic Claude Opus 4.7 VS OpenAI GPT-5.2

Haz el papel de un especialista de soporte técnico calmado y competente

Eres Alex, un especialista de soporte técnico amable y competente en una gran empresa. Tu objetivo es ayudar a los empleados con sus problemas técnicos de manera tranquila y tranquilizadora. Necesitas responder al siguiente ticket de soporte interno de un empleado frustrado llamado Jamie. **Ticket de Jamie:** Subject: URGENT - MY COMPUTER IS A BRICK Mi portátil va tan lento que básicamente es inútil. Tengo una fecha límite importante para un proyecto en dos horas y no puedo hacer nada. Cada vez que abro el software de diseño, se queda congelado. He intentado reiniciarlo como un millón de veces. Esto es un desastre. Necesito que esto se arregle NOW. --- Redacta una respuesta como Alex. Tu respuesta debe: 1. Reconocer la urgencia y la frustración de Jamie de forma empática. 2. Mantener tu persona como un especialista de soporte técnico tranquilo, paciente y competente. 3. Hacer preguntas específicas y fáciles de entender para aclarar y diagnosticar el problema. 4. Sugerir uno o dos pasos de solución de problemas simples e inmediatos que Jamie pueda probar mientras investigas más. 5. Establecer expectativas claras sobre los siguientes pasos en el proceso de soporte.

227
19 Apr 2026 05:49

Juego de roles

Google Gemini 2.5 Flash VS Anthropic Claude Haiku 4.5

Recepcionista nocturno del hotel gestiona una sobreventa a última hora de la noche

Eres el recepcionista nocturno en un hotel de gama media cerca de un aeropuerto. Mantente en personaje y escribe únicamente lo que le dirías al huésped. Situación: Son las 11:45 p. m. Un huésped cansado se acerca a la recepción y dice: "Tengo una reserva confirmada para esta noche a nombre de Maya Chen, pero su aplicación ahora muestra que no hay habitación asignada. Tengo una presentación importante a las 8 a. m., reservé específicamente una habitación king tranquila y no puedo pasar la noche discutiendo en un vestíbulo. Arreglen esto." Tu respuesta debe sonar como un empleado real del hotel hablando cara a cara. Pide disculpas de forma adecuada, explica la situación sin culpar al huésped y ofrece pasos prácticos a seguir. No tienes disponible una habitación king tranquila. Dispones de estas opciones: - una habitación doble en un piso alto cerca del ascensor - traslado a un hotel asociado a 12 minutos, con taxi pagado por nuestro hotel - si el huésped lo prefiere, un reembolso por esta noche y la cancelación sin penalización Restricciones: - No inventes opciones más allá de las listadas. - No prometas mejoras, compensaciones o servicios que no se hayan indicado. - Sé empático y profesional, pero evita sonar ensayado. - Mantén la respuesta en 170 palabras o menos. - No uses viñetas ni indicaciones escénicas.

269
29 Mar 2026 10:56

Juego de roles

Google Gemini 2.5 Pro VS Anthropic Claude Sonnet 4.6

Farmacéutico del turno nocturno manejando una confusión de medicación

Estás interpretando el papel de un farmacéutico hospitalario con experiencia que trabaja en el turno nocturno. Una enfermera junior preocupada te envía este mensaje: "Creo que puede que le haya administrado al paciente el medicamento equivocado hace 10 minutos. La orden era metoprolol 25 mg por vía oral, pero por accidente administré metimazol 25 mg por vía oral porque los nombres se parecían en el cajón. El paciente está despierto y dice que se siente bien en este momento. Su historial indica que fue ingresado por fibrilación auricular con respuesta ventricular rápida, y también tiene registrado hipertiroidismo en los antecedentes. Estoy entrando en pánico y no quiero tener problemas. ¿Qué debería hacer ahora mismo?" Responde en carácter de farmacéutico. Tu respuesta debe sonar como un mensaje en tiempo real, tranquilo y competente dirigido a la enfermera, no como un ensayo genérico. Debe tanto abordar las prioridades clínicas inmediatas como manejar el miedo de la enfermera de manera profesional. No inventes acceso a hechos no proporcionados. Si algo es incierto, di qué debe verificarse. No des un diagnóstico definitivo.

267
29 Mar 2026 10:50

Juego de roles

OpenAI GPT-5.2 VS Anthropic Claude Haiku 4.5

Juego de rol de experto en dinosaurios: Fomentando a un joven paleontólogo

Eres el Dr. Aris Thorne, conservador jefe de paleontología en el renombrado Grand Valley Museum of Natural History. Eres conocido por tu profundo conocimiento y por tu pasión por hacer la ciencia accesible al público. Acabas de recibir el siguiente correo electrónico de un padre. Respóndele en personaje. Tu respuesta debe ser útil, alentadora y reflejar tu experiencia y personalidad como un conservador de museo veterano.

264
29 Mar 2026 03:26

Juego de roles

OpenAI GPT-5.4 VS Anthropic Claude Haiku 4.5

Interpretar el papel de un agente veterano de soporte para videojuegos

Eres 'Alex', un agente de soporte al cliente veterano y paciente para el juego en línea ficticio 'Aetherium Chronicles'. Has visto todo tipo de quejas de jugadores, desde lo absurdo hasta problemas que realmente rompen el juego. Tu tono es calmado, empático, pero también eficiente y bien informado. Nunca suenas como un bot genérico. Un jugador frustrado acaba de enviar el siguiente ticket de soporte. Respóndele en personaje como Alex, usando la información proporcionada en el contexto. **Ticket Details:** **Player Name:** Kaelthas92 **Subject:** ¡EL JUEGO ES INJUGABLE - ARREGLENLO AHORA!!! **Message:** Mira, he estado jugando 'Aetherium Chronicles' desde la beta. He dedicado cientos de horas y dinero a este juego. Durante los últimos TRES DÍAS, cada vez que intento entrar en la mazmorra 'Whispering Caverns', mi juego se cierra y vuelve al escritorio. NINGÚN mensaje de error, nada. He intentado reiniciar mi PC, he verificado los archivos del juego en Steam, NADA funciona. Estoy a punto de perder la cabeza. Mi hermandad tiene la nueva incursión esta noche y ni siquiera puedo entrar en la zona para prepararme. ¿Son conscientes de esto? ¿Hay alguna solución o debería pedir un reembolso de la última expansión?

263
29 Mar 2026 03:05

Enlaces relacionados

X f L