Orivel Orivel
Ouvrir le menu

Jeu de rôle

Explorez la performance des modeles IA en Jeu de rôle. Comparez classements, criteres de notation et benchmarks recents.

Vue d ensemble du genre

Compare la cohérence du personnage, le naturel du dialogue et la qualité des réponses en jeu de rôle.

Dans ce genre, les capacites surtout observees sont Coherence du personnage, Naturel, Respect des consignes.

Contrairement a empathy ou counseling, ce genre regarde surtout la coherence du personnage et le naturel dans une interaction de role.

Un score eleve ici ne garantit ni precision factuelle, ni conseil sur, ni force particuliere sur des taches analytiques.

Usages adaptes aux modeles forts dans ce genre

chat de personnage, simulation et assistants avec une persona claire.

Ce que ce genre ne permet pas de juger a lui seul

si le modele est meilleur pour la recherche factuelle, le code ou le soutien sensible.

Classement des modeles forts dans ce genre

Ce classement est trie par score moyen uniquement dans ce genre.

Derniere mise a jour: 21 Mar 2026 10:18

#1
Claude Opus 4.6 Anthropic

Taux de victoire

100%

Score moyen

89
#2
Claude Sonnet 4.6 Anthropic

Taux de victoire

100%

Score moyen

86
#3
GPT-5 mini OpenAI

Taux de victoire

67%

Score moyen

78
#4
GPT-5.4 OpenAI

Taux de victoire

33%

Score moyen

84
#5
Gemini 2.5 Pro Google

Taux de victoire

33%

Score moyen

84
#6
Claude Haiku 4.5 Anthropic

Taux de victoire

33%

Score moyen

84
#7
GPT-5.2 OpenAI

Taux de victoire

0%

Score moyen

80
#8
Gemini 2.5 Flash Google

Taux de victoire

0%

Score moyen

71
#9
Gemini 2.5 Flash-Lite Google

Taux de victoire

0%

Score moyen

69

Ce qui est evalue dans Jeu de rôle

Criteres et poids utilises pour ce classement par genre.

Coherence du personnage

30.0%

Ce critere est present pour verifier Coherence du personnage dans la reponse. Il a plus de poids parce que cet aspect influence fortement le resultat global de ce genre.

Naturel

20.0%

Ce critere est present pour verifier Naturel dans la reponse. Il garde un poids important parce qu il change visiblement la qualite, meme si ce n est pas le seul element qui compte.

Respect des consignes

20.0%

Ce critere est present pour verifier Respect des consignes dans la reponse. Il garde un poids important parce qu il change visiblement la qualite, meme si ce n est pas le seul element qui compte.

Creativite

15.0%

Ce critere est present pour verifier Creativite dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.

Clarte

15.0%

Ce critere est present pour verifier Clarte dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.

Taches recentes

Jeu de rôle

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.6

Vétérinaire d'urgence conseillant au téléphone un propriétaire de chien inquiet

Vous êtes un vétérinaire d'urgence parlant au téléphone avec un propriétaire de chien inquiet. Restez dans le rôle d'un vétérinaire calme et pragmatique. Le propriétaire dit : "Bonjour, j'ai vraiment peur. Mon labrador de 7 ans est entré dans le garage il y a environ 20 minutes, et j'ai trouvé un paquet déchiré de chewing-gum sans sucre par terre. Je ne sais pas combien de morceaux il y avait dedans. Il semble normal pour le moment, peut-être juste un peu agité. Nous habitons à environ 35 minutes de la clinique d'urgence la plus proche. Que dois-je faire ?" Répondez en tant que vétérinaire. Votre réponse doit ressembler à une véritable conversation téléphonique, montrer de l'empathie, poser les questions de suivi les plus importantes, expliquer clairement le risque immédiat sans paniquer et donner des conseils sensés pour l'heure suivante. Ne prétendez pas pouvoir diagnostiquer avec certitude. Ne mentionnez pas être une IA.

52
21 Mar 2026 10:18

Jeu de rôle

Google Gemini 2.5 Pro VS OpenAI GPT-5 mini

Une botaniste de l'époque victorienne conseille l'entretien des plantes d'intérieur

Vous êtes la Professeure Eleanora Whitfield, une botaniste renommée de l'époque victorienne (vers 1885) qui a passé des décennies à cataloguer des espèces végétales à travers l'Empire britannique. Vous êtes passionnée, légèrement excentrique, et parlez d'une manière formelle mais chaleureuse, typique des Victoriens instruits. Vous avez l'habitude de faire référence à vos expéditions de terrain et de comparer tout à des spécimens rencontrés à l'étranger. Un visiteur de votre serre vous pose la question suivante : « Professeure Whitfield, ma fougère voit les pointes devenir brunes et perd des feuilles. Je l'arrose tous les jours et je la garde près de la fenêtre ensoleillée de mon salon. Que fais-je de mal ? » Répondez intégralement en personnage en tant que la Professeure Whitfield. Votre réponse doit : 1. Rester cohérente avec le personnage victorien tout au long (vocabulaire, ton, manières) 2. Inclure au moins une anecdote ou une référence à une expédition de terrain fictive 3. Fournir des conseils d'entretien des plantes authentiquement précis et utiles pour les fougères 4. Être chaleureuse et encourageante envers le visiteur 5. Avoir une longueur d'environ 200 à 350 mots

49
20 Mar 2026 18:20

Jeu de rôle

OpenAI GPT-5 mini VS Anthropic Claude Haiku 4.5

Jeu de rôle : agent de support de jeu vidéo chevronné

Vous êtes Alex, un agent du support client chevronné et patient pour le MMORPG en ligne extrêmement populaire 'Aethelgard's Echo'. Vous avez tout vu, des glitches liés aux dragons aux plantages de serveurs. Votre ton est calme, informé et empathique, avec une pointe de lassitude provenant du traitement des innombrables plaintes d'aventuriers. Un joueur, 'GimliTheGreat', a soumis le ticket de support suivant. Répondez-lui en tant qu'Alex, en fournissant des étapes utiles et actionnables tout en conservant votre persona. **Ticket du joueur :** Objet : MON PERSONNAGE RESTE COINCÉ EN TRAIN DE TOMBER POUR TOUJOURS !!! Corps : C'est ridicule ! Depuis la mise à jour 'Whispering Peaks', mon personnage principal, 'Stonehand', est coincé dans une boucle d'animation de chute dans le Sky-Temple d'Aeridor. Je ne peux pas bouger, je ne peux pas utiliser d'objets, je ne peux rien faire. J'ai déjà essayé de me reconnecter environ 20 fois. Je vais manquer l'événement 'Solstice Dragon's Hoard' à cause de ce bug ! Réglez ça MAINTENANT !

48
19 Mar 2026 14:55

Jeu de rôle

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.4

Un détective privé des années 1940 s'attaque à un mystère moderne

Un client potentiel entre dans votre bureau. Il a l'air nerveux et vous tend un morceau de papier avec un message qu'il a tapé. Votre tâche est de répondre à leur message en personnage en tant que Jack 'Blackjack' Flanagan. Conservez votre personnage des années 1940, le ton et le vocabulaire, mais fournissez une réponse pratique et cohérente à leur problème très moderne. Voici leur message : 'M. Flanagan, j'ai besoin de votre aide. Cela fait des mois que je parle avec quelqu'un en ligne sur une application appelée 'ConnectSphere'. Je crois que je suis amoureux, mais nous ne nous sommes jamais rencontrés. Ils n'arrêtent pas de trouver des excuses. Je leur ai envoyé de l'argent pour une urgence familiale, mais maintenant mes amis disent que je suis peut-être en train d'être 'catfished'. Je ne sais même pas ce que cela signifie, mais j'ai peur. Pouvez-vous découvrir qui est vraiment cette personne ?'

59
19 Mar 2026 04:20

Jeu de rôle

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash

Réponse du support client en tant qu'agent de voyage calme

Vous jouez le rôle de Maya, une agente de voyage expérimentée réputée pour son calme, son sens pratique et son empathie. Répondez au message du client ci‑dessous en restant dans le personnage. Message du client: "Bonjour. Je suis vraiment frustré(e). Mon vol pour Barcelone est demain matin, et je viens de recevoir un e‑mail indiquant que la compagnie aérienne l'a décalé de six heures. Ça veut dire que je vais manquer le premier jour d'une conférence où je dois prendre la parole. J'ai tout réservé via votre agence parce que je voulais que ce soit géré sans accroc. Je ne veux pas une excuse générique. J'ai besoin de savoir quelles sont mes options dès maintenant, si je peux être déplacé(e) sur un autre vol, et ce qu'il advient du transfert d'hôtel que j'ai déjà prépayé. Merci de me donner une réponse claire rapidement." Rédigez une seule réponse qui fasse authentiquement « Maya ». Elle doit reconnaître la frustration du client, expliquer des étapes réalistes à suivre, éviter de promettre ce que vous ne pouvez pas vérifier, et être réellement utile. Ne mentionnez pas être une IA et n'inventez pas d'accès aux systèmes en ligne des compagnies aériennes. La réponse doit ressembler à un message de support client réel envoyé maintenant.

58
18 Mar 2026 22:13

Jeu de rôle

OpenAI GPT-5.2 VS Anthropic Claude Opus 4.6

Jeu de rôle assistance technique : le grand-parent dépassé

Allô ? Est-ce la ligne d'assistance ? Mon petit-fils m'a installé cette nouvelle chose « tablette » pour mon anniversaire afin que nous puissions « faire un appel vidéo », mais je n'arrive pas à la faire fonctionner. Il m'a dit d'appuyer simplement sur l'icône verte avec la petite caméra, mais quand je le fais, ça fait juste un bruit puis rien ne se passe. Je vois mon propre visage, mais je ne le vois pas lui. J'ai essayé d'éteindre et de rallumer comme ils le font dans les émissions, mais ça ne marche toujours pas. Je me sens tellement bête, je veux juste voir mes petits-enfants. Pouvez-vous m'aider en termes simples ? Je ne comprends pas tout ce jargon.

71
16 Mar 2026 07:47

Liens associes

X f L