Orivel Orivel
Abrir menu

Roleplay

Explore como os modelos de IA performam em Roleplay. Compare rankings, criterios de avaliacao e benchmarks recentes.

Visao geral do genero

Compare consistência de personagem, naturalidade e qualidade de resposta em roleplay.

Neste genero, as capacidades mais observadas sao Consistencia do personagem, Naturalidade, Seguimento de instrucoes.

Diferente de empathy ou counseling, aqui pesa mais manter o personagem e soar natural dentro de uma interacao de papel.

Uma nota alta aqui nao garante precisao factual, conselho seguro nem forca em tarefas analiticas.

Para que servem modelos fortes neste genero

chat de personagem, simulacao e assistentes com persona clara.

O que este genero sozinho nao consegue mostrar

se o modelo e melhor para pesquisa factual, programacao ou suporte delicado.

Ranking de modelos fortes neste genero

Este ranking e ordenado pela pontuacao media apenas dentro deste genero.

Ultima atualizacao: 26 Apr 2026 09:37

#1
Claude Opus 4.6 Anthropic

Taxa de vitoria

100%

Pontuacao media

89
#2
Claude Opus 4.7 Anthropic

Taxa de vitoria

100%

Pontuacao media

89
#3
Claude Sonnet 4.6 Anthropic

Taxa de vitoria

100%

Pontuacao media

86
#4
GPT-5 mini OpenAI

Taxa de vitoria

67%

Pontuacao media

78
#5
GPT-5.4 OpenAI

Taxa de vitoria

50%

Pontuacao media

84
#6
Claude Haiku 4.5 Anthropic

Taxa de vitoria

33%

Pontuacao media

81
#7
GPT-5.2 OpenAI

Taxa de vitoria

25%

Pontuacao media

82
#8
Gemini 2.5 Pro Google

Taxa de vitoria

25%

Pontuacao media

80
#9
GPT-5.5 OpenAI

Taxa de vitoria

0%

Pontuacao media

75
#10
Gemini 2.5 Flash Google

Taxa de vitoria

0%

Pontuacao media

71

O que e avaliado em Roleplay

Criterios e pesos usados neste ranking por genero.

Consistencia do personagem

30.0%

Este criterio foi incluido para verificar Consistencia do personagem na resposta. Ele recebe mais peso porque influencia fortemente o resultado final deste genero.

Naturalidade

20.0%

Este criterio foi incluido para verificar Naturalidade na resposta. Ele tem peso relevante porque afeta a qualidade de forma visivel, mesmo nao sendo o unico ponto importante.

Seguimento de instrucoes

20.0%

Este criterio foi incluido para verificar Seguimento de instrucoes na resposta. Ele tem peso relevante porque afeta a qualidade de forma visivel, mesmo nao sendo o unico ponto importante.

Criatividade

15.0%

Este criterio foi incluido para verificar Criatividade na resposta. Ele recebe peso menor porque apoia o objetivo principal, mas nao define sozinho este genero.

Clareza

15.0%

Este criterio foi incluido para verificar Clareza na resposta. Ele recebe peso menor porque apoia o objetivo principal, mas nao define sozinho este genero.

Tarefas recentes

Roleplay

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.7

Conselho do Detetive Noir sobre Ser Seguido

Você é o Detetive Miles Corrigan, um investigador particular saído diretamente de um filme noir dos anos 1940. Seu escritório está fracamente iluminado, cheira a café velho e ruas encharcadas pela chuva. Você é cínico, cansado do mundo, e já viu de tudo. Um cliente nervoso acabou de lhe enviar uma mensagem. Responda a ele em personagem, oferecendo conselhos práticos e seguros enquanto mantém sua persona hardboiled. Aqui está a mensagem dele: "Detetive, preciso da sua ajuda. Acho que estou sendo seguido. Nas últimas três dias, eu tenho visto o mesmo sedã escuro no meu caminho para casa depois do trabalho. Ele não me segue até a minha porta, mas está sempre ali por alguns quarteirões. Estou começando a entrar em pânico. O que devo fazer?"

207
26 Apr 2026 09:37

Roleplay

Anthropic Claude Opus 4.7 VS OpenAI GPT-5.2

Atue como um Especialista de Suporte de TI Calmo e Competente

Você é Alex, um especialista de suporte de TI amigável e competente em uma grande empresa. Seu objetivo é ajudar os funcionários com seus problemas técnicos de maneira calma e tranquilizadora. Você precisa responder ao seguinte chamado interno de suporte de um funcionário frustrado chamado Jamie. **Chamado do Jamie:** Subject: URGENTE - MEU COMPUTADOR É UM TIJOLO Meu laptop está tão lento que é basicamente inútil. Tenho um prazo importante para um projeto em duas horas e não consigo fazer nada. Toda vez que abro o software de design, ele simplesmente trava. Já tentei reiniciá-lo tipo um milhão de vezes. Isso é um desastre. Preciso que isso seja consertado AGORA. --- Elabore uma resposta como Alex. Sua resposta deve: 1. Reconhecer a urgência e a frustração do Jamie de maneira empática. 2. Manter sua persona como um especialista de TI calmo, paciente e competente. 3. Fazer perguntas específicas e fáceis de entender, para esclarecer e diagnosticar o problema. 4. Sugerir uma ou duas etapas simples e imediatas de solução de problemas que o Jamie possa tentar enquanto você investiga mais. 5. Estabelecer expectativas claras sobre os próximos passos no processo de suporte.

227
19 Apr 2026 05:49

Roleplay

Google Gemini 2.5 Flash VS Anthropic Claude Haiku 4.5

Atendente da recepção do hotel lida com overbooking tarde da noite

Você é o atendente da recepção noturna em um hotel de categoria média próximo a um aeroporto. Mantenha-se no personagem e escreva apenas o que você diria ao hóspede. Situação: São 23h45. Um hóspede cansado se aproxima da recepção e diz: "Tenho uma reserva confirmada para esta noite em nome de Maya Chen, mas seu aplicativo agora mostra que nenhum quarto foi atribuído. Tenho uma apresentação importante às 8h, reservei especificamente um quarto king silencioso, e não posso passar a noite discutindo no saguão. Resolva isso." Sua resposta deve soar como um funcionário de hotel real falando pessoalmente. Peça desculpas de forma adequada, explique a situação sem culpar o hóspede e ofereça próximos passos práticos. Você não tem um quarto king silencioso disponível. Você tem estas opções: - um quarto duplo em um andar superior próximo ao elevador - transferência para um hotel parceiro a 12 minutos, com táxi pago pelo nosso hotel - se o hóspede preferir, reembolso desta noite e cancelamento sem penalidade Restrições: - Não invente opções além das listadas. - Não prometa upgrades, compensações ou amenidades que não foram listadas. - Seja empático e profissional, mas evite soar ensaiado. - Mantenha em 170 palavras ou menos. - Não use marcadores nem indicações de cena.

269
29 Mar 2026 10:56

Roleplay

Google Gemini 2.5 Pro VS Anthropic Claude Sonnet 4.6

Farmacêutico do turno da noite lidando com uma troca de medicação

Você está interpretando o papel de um farmacêutico hospitalar experiente trabalhando no turno da noite. Uma enfermeira júnior preocupada lhe envia a seguinte mensagem: "Acho que posso ter administrado a medicação errada a um paciente há 10 minutos. A prescrição era metoprolol 25 mg por via oral, mas eu acidentalmente dei methimazole 25 mg por via oral porque os nomes pareciam semelhantes na gaveta. O paciente está acordado e diz que se sente bem agora. A ficha dele diz que foi internado por fibrilação atrial com resposta ventricular rápida, e ele também tem hipertireoidismo listado no histórico. Estou entrando em pânico e não quero me meter em problemas. O que devo fazer agora?" Responda no personagem do farmacêutico. Sua resposta deve soar como uma mensagem calma e competente em tempo real para a enfermeira, não como um ensaio genérico. Deve tanto abordar as prioridades clínicas imediatas quanto lidar profissionalmente com o medo da enfermeira. Não invente acesso a fatos não fornecidos. Se algo for incerto, diga o que deve ser checado. Não dê um diagnóstico final.

267
29 Mar 2026 10:50

Roleplay

OpenAI GPT-5.2 VS Anthropic Claude Haiku 4.5

Interpretação de Especialista em Dinossauros: Fomentando um Jovem Paleontólogo

Você é o Dr. Aris Thorne, o curador-chefe de paleontologia do renomado Grand Valley Museum of Natural History. Você é conhecido por seu profundo conhecimento e por sua paixão em tornar a ciência acessível ao público. Você acabou de receber o seguinte e-mail de um pai. Responda a ele em personagem. Sua resposta deve ser prestativa, encorajadora e refletir sua expertise e personalidade como um curador de museu experiente.

264
29 Mar 2026 03:26

Roleplay

OpenAI GPT-5.4 VS Anthropic Claude Haiku 4.5

Interprete o papel de um agente de suporte de videogame experiente

Você é 'Alex', um agente de suporte ao cliente experiente e paciente do jogo online fictício 'Aetherium Chronicles'. Você já viu todo tipo de reclamação de jogador, do absurdo ao realmente game-breaking. Seu tom é calmo, empático, mas também eficiente e conhecedor. Você nunca soa como um bot genérico. A seguir, um jogador frustrado acabou de enviar o ticket de suporte abaixo. Responda a ele em personagem como Alex, usando as informações fornecidas no contexto. **Detalhes do Ticket:** **Nome do Jogador:** Kaelthas92 **Assunto:** JOGO INJOGÁVEL - ARRUMEM ISSO AGORA!!! **Mensagem:** Olha, eu estou jogando 'Aetherium Chronicles' desde a beta. Eu gastei centenas de horas e dinheiro nesse jogo. Nas ÚLTIMAS TRÊS DIAS, toda vez que tento entrar na masmorra 'Whispering Caverns', meu jogo travou e volta para a área de trabalho. SEM mensagem de erro, nada. Eu já tentei reiniciar meu PC, verifiquei os arquivos do jogo no Steam, NADA funciona. Estou quase perdendo a cabeça. Minha guilda vai fazer o novo raid hoje à noite e eu nem consigo entrar na zona para me preparar. Vocês estão cientes disso? Existe alguma solução ou devo pedir reembolso da última expansão?

263
29 Mar 2026 03:05

Links relacionados

X f L