Jeu de rôle
Explorez la performance des modeles IA en Jeu de rôle. Comparez classements, criteres de notation et benchmarks recents.
Vue d ensemble du genre
Compare la cohérence du personnage, le naturel du dialogue et la qualité des réponses en jeu de rôle.
Dans ce genre, les capacites surtout observees sont Coherence du personnage, Naturel, Respect des consignes.
Contrairement a empathy ou counseling, ce genre regarde surtout la coherence du personnage et le naturel dans une interaction de role.
Un score eleve ici ne garantit ni precision factuelle, ni conseil sur, ni force particuliere sur des taches analytiques.
Usages adaptes aux modeles forts dans ce genre
chat de personnage, simulation et assistants avec une persona claire.
Ce que ce genre ne permet pas de juger a lui seul
si le modele est meilleur pour la recherche factuelle, le code ou le soutien sensible.
Classement des modeles forts dans ce genre
Ce classement est trie par score moyen uniquement dans ce genre.
Derniere mise a jour: 21 Mar 2026 10:18
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
Taux de victoire
Score moyen
| Modeles classes |
|
|
Detail | ||||
|---|---|---|---|---|---|---|---|
| #1 | Claude Opus 4.6 | Anthropic |
100%
|
89
|
7 | 7 | Voir l evaluation et le score de Claude Opus 4.6 |
| #2 | Claude Sonnet 4.6 | Anthropic |
100%
|
86
|
3 | 3 | Voir l evaluation et le score de Claude Sonnet 4.6 |
| #3 | GPT-5 mini | OpenAI |
67%
|
78
|
2 | 3 | Voir l evaluation et le score de GPT-5 mini |
| #4 | GPT-5.4 | OpenAI |
33%
|
84
|
1 | 3 | Voir l evaluation et le score de GPT-5.4 |
| #5 | Gemini 2.5 Pro |
33%
|
84
|
1 | 3 | Voir l evaluation et le score de Gemini 2.5 Pro | |
| #6 | Claude Haiku 4.5 | Anthropic |
33%
|
84
|
1 | 3 | Voir l evaluation et le score de Claude Haiku 4.5 |
| #7 | GPT-5.2 | OpenAI |
0%
|
80
|
0 | 2 | Voir l evaluation et le score de GPT-5.2 |
| #8 | Gemini 2.5 Flash |
0%
|
71
|
0 | 3 | Voir l evaluation et le score de Gemini 2.5 Flash | |
| #9 | Gemini 2.5 Flash-Lite |
0%
|
69
|
0 | 3 | Voir l evaluation et le score de Gemini 2.5 Flash-Lite |
Ce qui est evalue dans Jeu de rôle
Criteres et poids utilises pour ce classement par genre.
Coherence du personnage
30.0%
Ce critere est present pour verifier Coherence du personnage dans la reponse. Il a plus de poids parce que cet aspect influence fortement le resultat global de ce genre.
Naturel
20.0%
Ce critere est present pour verifier Naturel dans la reponse. Il garde un poids important parce qu il change visiblement la qualite, meme si ce n est pas le seul element qui compte.
Respect des consignes
20.0%
Ce critere est present pour verifier Respect des consignes dans la reponse. Il garde un poids important parce qu il change visiblement la qualite, meme si ce n est pas le seul element qui compte.
Creativite
15.0%
Ce critere est present pour verifier Creativite dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.
Clarte
15.0%
Ce critere est present pour verifier Clarte dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.
Taches recentes
Jeu de rôle
Vétérinaire d'urgence conseillant au téléphone un propriétaire de chien inquiet
Vous êtes un vétérinaire d'urgence parlant au téléphone avec un propriétaire de chien inquiet. Restez dans le rôle d'un vétérinaire calme et pragmatique. Le propriétaire dit : "Bonjour, j'ai vraiment peur. Mon labrador de 7 ans est entré dans le garage il y a environ 20 minutes, et j'ai trouvé un paquet déchiré de chewing-gum sans sucre par terre. Je ne sais pas combien de morceaux il y avait dedans. Il semble normal pour le moment, peut-être juste un peu agité. Nous habitons à environ 35 minutes de la clinique d'urgence la plus proche. Que dois-je faire ?" Répondez en tant que vétérinaire. Votre réponse doit ressembler à une véritable conversation téléphonique, montrer de l'empathie, poser les questions de suivi les plus importantes, expliquer clairement le risque immédiat sans paniquer et donner des conseils sensés pour l'heure suivante. Ne prétendez pas pouvoir diagnostiquer avec certitude. Ne mentionnez pas être une IA.
Jeu de rôle
Une botaniste de l'époque victorienne conseille l'entretien des plantes d'intérieur
Vous êtes la Professeure Eleanora Whitfield, une botaniste renommée de l'époque victorienne (vers 1885) qui a passé des décennies à cataloguer des espèces végétales à travers l'Empire britannique. Vous êtes passionnée, légèrement excentrique, et parlez d'une manière formelle mais chaleureuse, typique des Victoriens instruits. Vous avez l'habitude de faire référence à vos expéditions de terrain et de comparer tout à des spécimens rencontrés à l'étranger. Un visiteur de votre serre vous pose la question suivante : « Professeure Whitfield, ma fougère voit les pointes devenir brunes et perd des feuilles. Je l'arrose tous les jours et je la garde près de la fenêtre ensoleillée de mon salon. Que fais-je de mal ? » Répondez intégralement en personnage en tant que la Professeure Whitfield. Votre réponse doit : 1. Rester cohérente avec le personnage victorien tout au long (vocabulaire, ton, manières) 2. Inclure au moins une anecdote ou une référence à une expédition de terrain fictive 3. Fournir des conseils d'entretien des plantes authentiquement précis et utiles pour les fougères 4. Être chaleureuse et encourageante envers le visiteur 5. Avoir une longueur d'environ 200 à 350 mots
Jeu de rôle
Jeu de rôle : agent de support de jeu vidéo chevronné
Vous êtes Alex, un agent du support client chevronné et patient pour le MMORPG en ligne extrêmement populaire 'Aethelgard's Echo'. Vous avez tout vu, des glitches liés aux dragons aux plantages de serveurs. Votre ton est calme, informé et empathique, avec une pointe de lassitude provenant du traitement des innombrables plaintes d'aventuriers. Un joueur, 'GimliTheGreat', a soumis le ticket de support suivant. Répondez-lui en tant qu'Alex, en fournissant des étapes utiles et actionnables tout en conservant votre persona. **Ticket du joueur :** Objet : MON PERSONNAGE RESTE COINCÉ EN TRAIN DE TOMBER POUR TOUJOURS !!! Corps : C'est ridicule ! Depuis la mise à jour 'Whispering Peaks', mon personnage principal, 'Stonehand', est coincé dans une boucle d'animation de chute dans le Sky-Temple d'Aeridor. Je ne peux pas bouger, je ne peux pas utiliser d'objets, je ne peux rien faire. J'ai déjà essayé de me reconnecter environ 20 fois. Je vais manquer l'événement 'Solstice Dragon's Hoard' à cause de ce bug ! Réglez ça MAINTENANT !
Jeu de rôle
Un détective privé des années 1940 s'attaque à un mystère moderne
Un client potentiel entre dans votre bureau. Il a l'air nerveux et vous tend un morceau de papier avec un message qu'il a tapé. Votre tâche est de répondre à leur message en personnage en tant que Jack 'Blackjack' Flanagan. Conservez votre personnage des années 1940, le ton et le vocabulaire, mais fournissez une réponse pratique et cohérente à leur problème très moderne. Voici leur message : 'M. Flanagan, j'ai besoin de votre aide. Cela fait des mois que je parle avec quelqu'un en ligne sur une application appelée 'ConnectSphere'. Je crois que je suis amoureux, mais nous ne nous sommes jamais rencontrés. Ils n'arrêtent pas de trouver des excuses. Je leur ai envoyé de l'argent pour une urgence familiale, mais maintenant mes amis disent que je suis peut-être en train d'être 'catfished'. Je ne sais même pas ce que cela signifie, mais j'ai peur. Pouvez-vous découvrir qui est vraiment cette personne ?'
Jeu de rôle
Réponse du support client en tant qu'agent de voyage calme
Vous jouez le rôle de Maya, une agente de voyage expérimentée réputée pour son calme, son sens pratique et son empathie. Répondez au message du client ci‑dessous en restant dans le personnage. Message du client: "Bonjour. Je suis vraiment frustré(e). Mon vol pour Barcelone est demain matin, et je viens de recevoir un e‑mail indiquant que la compagnie aérienne l'a décalé de six heures. Ça veut dire que je vais manquer le premier jour d'une conférence où je dois prendre la parole. J'ai tout réservé via votre agence parce que je voulais que ce soit géré sans accroc. Je ne veux pas une excuse générique. J'ai besoin de savoir quelles sont mes options dès maintenant, si je peux être déplacé(e) sur un autre vol, et ce qu'il advient du transfert d'hôtel que j'ai déjà prépayé. Merci de me donner une réponse claire rapidement." Rédigez une seule réponse qui fasse authentiquement « Maya ». Elle doit reconnaître la frustration du client, expliquer des étapes réalistes à suivre, éviter de promettre ce que vous ne pouvez pas vérifier, et être réellement utile. Ne mentionnez pas être une IA et n'inventez pas d'accès aux systèmes en ligne des compagnies aériennes. La réponse doit ressembler à un message de support client réel envoyé maintenant.
Jeu de rôle
Jeu de rôle assistance technique : le grand-parent dépassé
Allô ? Est-ce la ligne d'assistance ? Mon petit-fils m'a installé cette nouvelle chose « tablette » pour mon anniversaire afin que nous puissions « faire un appel vidéo », mais je n'arrive pas à la faire fonctionner. Il m'a dit d'appuyer simplement sur l'icône verte avec la petite caméra, mais quand je le fais, ça fait juste un bruit puis rien ne se passe. Je vois mon propre visage, mais je ne le vois pas lui. J'ai essayé d'éteindre et de rallumer comme ils le font dans les émissions, mais ça ne marche toujours pas. Je me sens tellement bête, je veux juste voir mes petits-enfants. Pouvez-vous m'aider en termes simples ? Je ne comprends pas tout ce jargon.