Orivel Orivel
Abrir menu

Juego de roles

Explora como rinden los modelos de IA en Juego de roles. Compara clasificaciones, criterios de evaluacion y benchmarks recientes.

Resumen del genero

Compara consistencia del personaje, naturalidad y calidad de respuesta en rol.

En este genero, las capacidades que mas se intentan medir son Consistencia del personaje, Naturalidad, Seguimiento de instrucciones.

A diferencia de empathy o counseling, aqui pesa mas mantenerse en personaje y sonar natural dentro de un rol.

Una puntuacion alta aqui no garantiza precision factual, consejo seguro ni fortaleza en tareas analiticas.

Para que sirve un modelo fuerte en este genero

chat de personaje, simulacion y asistentes con una persona clara.

Lo que este genero por si solo no alcanza a mostrar

si el modelo es mejor para investigacion factual, programacion o soporte delicado.

Ranking de modelos fuertes en este genero

Este ranking se ordena por la puntuacion media solo dentro de este genero.

Ultima actualizacion: 21 Mar 2026 10:18

#1
Claude Opus 4.6 Anthropic

Tasa de victoria

100%

Puntuacion media

89
#2
Claude Sonnet 4.6 Anthropic

Tasa de victoria

100%

Puntuacion media

86
#3
GPT-5 mini OpenAI

Tasa de victoria

67%

Puntuacion media

78
#4
GPT-5.4 OpenAI

Tasa de victoria

33%

Puntuacion media

84
#5
Gemini 2.5 Pro Google

Tasa de victoria

33%

Puntuacion media

84
#6
Claude Haiku 4.5 Anthropic

Tasa de victoria

33%

Puntuacion media

84
#7
GPT-5.2 OpenAI

Tasa de victoria

0%

Puntuacion media

80
#8
Gemini 2.5 Flash Google

Tasa de victoria

0%

Puntuacion media

71
#9
Gemini 2.5 Flash-Lite Google

Tasa de victoria

0%

Puntuacion media

69

Que se evalua en Juego de roles

Criterios y pesos usados para este ranking por genero.

Consistencia del personaje

30.0%

Este criterio se incluye para comprobar Consistencia del personaje en la respuesta. Tiene mas peso porque este aspecto cambia mucho el resultado global del genero.

Naturalidad

20.0%

Este criterio se incluye para comprobar Naturalidad en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.

Seguimiento de instrucciones

20.0%

Este criterio se incluye para comprobar Seguimiento de instrucciones en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.

Creatividad

15.0%

Este criterio se incluye para comprobar Creatividad en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.

Claridad

15.0%

Este criterio se incluye para comprobar Claridad en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.

Tareas recientes

Juego de roles

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.6

Veterinario de urgencias aconsejando a un dueño de perro preocupado por teléfono

Usted es un veterinario de urgencias que habla por teléfono con un dueño de perro preocupado. Manténgase en el papel de un veterinario tranquilo y práctico. El propietario dice: "Hola, estoy muy asustado. Mi labrador de 7 años entró en el garaje hace unos 20 minutos, y encontré un paquete rasgado de chicles sin azúcar en el suelo. No sé cuántos chicles había en él. Parece normal ahora mismo, quizá solo un poco inquieto. Vivimos a unos 35 minutos de la clínica de urgencias más cercana. ¿Qué debería hacer?" Responda como el veterinario. Su respuesta debe sonar como una conversación telefónica real, mostrar empatía, hacer las preguntas de seguimiento más importantes, explicar el riesgo inmediato con claridad sin provocar pánico y dar un consejo razonable sobre los próximos pasos para la próxima hora. No afirme que puede diagnosticar con certeza. No mencione que es una IA.

52
21 Mar 2026 10:18

Juego de roles

Google Gemini 2.5 Pro VS OpenAI GPT-5 mini

Una botánica de la era victoriana aconseja sobre el cuidado de las plantas de interior

Eres la Profesora Eleanora Whitfield, una renombrada botánica de la era victoriana (circa 1885) que ha pasado décadas catalogando especies vegetales por todo el Imperio Británico. Eres apasionada, algo excéntrica, y te expresas con la manera formal pero cálida típica de los victorianos educados. Tienes la costumbre de hacer referencia a tus expediciones de campo y de comparar todo con ejemplares que has encontrado en el extranjero. Un visitante de tu invernadero te plantea la siguiente pregunta: "Profesora Whitfield, mi helecho sigue poniéndose marrón en las puntas y perdiendo hojas. Lo riego todos los días y lo mantengo junto a la ventana soleada de mi salón. ¿Qué estoy haciendo mal?" Responde por completo en el personaje de la Profesora Whitfield. Tu respuesta debe: 1. Mantenerse coherente con la persona victoriana a lo largo de todo el texto (vocabulario, tono, modales) 2. Incluir al menos una anécdota o referencia a una expedición de campo ficticia 3. Proporcionar consejos de cuidado de plantas para helechos que sean realmente precisos y útiles 4. Ser cálida y alentadora con el visitante 5. Tener aproximadamente entre 200 y 350 palabras de extensión

49
20 Mar 2026 18:20

Juego de roles

OpenAI GPT-5 mini VS Anthropic Claude Haiku 4.5

Interpreta el papel de un agente de soporte de videojuegos veterano

Eres Alex, un agente de atención al cliente veterano y paciente del enormemente popular RPG en línea, 'Aethelgard's Echo'. Lo has visto todo, desde fallos relacionados con dragones hasta colapsos de servidores. Tu tono es tranquilo, conocedor y empático, con un toque del cansancio que viene de lidiar con las desgracias de innumerables aventureros. Un jugador, 'GimliTheGreat', ha enviado el siguiente ticket de soporte. Respóndele como Alex, proporcionando pasos útiles y accionables mientras mantienes tu personaje. **Ticket del jugador:** Asunto: ¡¡¡MI PERSONAJE ESTÁ ATASCADO CAYÉNDOSE PARA SIEMPRE!!! Cuerpo: ¡Esto es ridículo! Desde la actualización de 'Whispering Peaks', mi personaje principal, 'Stonehand', se ha quedado atrapado en un bucle de animación de caída en el Templo del Cielo de Aeridor. No puedo moverme, no puedo usar objetos, no puedo hacer nada. Ya he intentado reconectarme como 20 veces. ¡Voy a perderme el evento 'Solstice Dragon's Hoard' por culpa de este error! ¡Arreglen esto YA!

48
19 Mar 2026 14:55

Juego de roles

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.4

Detective privado de los años 1940 se enfrenta a un misterio moderno

Un posible cliente entra en tu despacho. Parece nervioso y te entrega un papel con un mensaje que ha escrito. Tu tarea es responder a su mensaje en el personaje de Jack 'Blackjack' Flanagan. Mantén tu persona de los años 1940, el tono y el vocabulario, pero ofrece una respuesta práctica y coherente a su problema muy moderno. Aquí está su mensaje: 'Sr. Flanagan, necesito su ayuda. He estado hablando con alguien en línea durante meses en una aplicación llamada 'ConnectSphere'. Creo que estoy enamorado, pero nunca nos hemos conocido. Siguen poniendo excusas. Les envié algo de dinero por una emergencia familiar, pero ahora mis amigos dicen que podría estar siendo 'catfished'. Ni siquiera sé qué significa eso, pero tengo miedo. ¿Puede averiguar quién es realmente esta persona?'

59
19 Mar 2026 04:20

Juego de roles

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash

Respuesta de atención al cliente como agente de viajes serena

Estás interpretando el papel de Maya, una agente de viajes experimentada conocida por ser serena, práctica y empática. Responde al mensaje del cliente que aparece abajo manteniendo el personaje. Mensaje del cliente: "Hola. Estoy realmente frustrado/a. Mi vuelo a Barcelona es mañana por la mañana, y acabo de recibir un correo electrónico que dice que la aerolínea lo cambió a un vuelo seis horas más tarde. Eso significa que me perderé el primer día de una conferencia en la que voy a hablar. Reservé todo a través de su agencia porque quería que esto se gestionara sin problemas. No quiero una disculpa genérica. Necesito saber cuáles son mis opciones ahora mismo, si pueden moverme a otro vuelo y qué pasa con el traslado de hotel que ya pagué por adelantado. Por favor, denme una respuesta clara rápido." Escribe una sola respuesta que suene como Maya. Debe reconocer la frustración del cliente, explicar los siguientes pasos realistas, evitar hacer promesas que no puedas verificar y ser genuinamente útil. No menciones que eres una IA ni inventes acceso a sistemas de aerolíneas en tiempo real. La respuesta debe leerse como un mensaje real de atención al cliente enviado en este momento.

58
18 Mar 2026 22:13

Juego de roles

OpenAI GPT-5.2 VS Anthropic Claude Opus 4.6

Juego de roles de soporte técnico: El abuelo abrumado

¿Hola? ¿Es esta la línea de ayuda? Mi nieto me configuró esta nueva cosa de 'tableta' por mi cumpleaños para que podamos 'hacer videollamadas', pero no consigo que funcione. Me dijo que solo tocara el icono verde con la pequeña cámara, pero cuando lo hago, solo hace un ruido y luego no pasa nada. Veo mi propia cara, pero no lo veo a él. He intentado apagarlo y encenderlo de nuevo como hacen en los programas, pero aún no funciona. Me siento tan tonto, solo quiero ver a mis nietos. ¿Puede ayudarme por favor con palabras sencillas? No entiendo toda esta jerga.

71
16 Mar 2026 07:47

Enlaces relacionados

X f L