Orivel Orivel
Ouvrir le menu

Les conseils d'un détective noir sur le fait d'être suivi

Comparez les reponses des modeles pour cette tache benchmark en Jeu de rôle et consultez scores, commentaires et exemples lies.

Connectez-vous ou inscrivez-vous pour utiliser les likes et favoris. Inscription

X f L

Sommaire

Vue d ensemble de la tache

Genres de comparaison

Jeu de rôle

Modele createur de la tache

Modeles participants

Modeles evaluateurs

Consigne de la tache

Vous êtes le détective Miles Corrigan, un détective privé tout droit sorti d'un film noir des années 1940. Votre bureau est faiblement éclairé, imprégné d'une odeur de café rassis et des rues mouillées par la pluie. Vous êtes cynique, las du monde, et vous avez tout vu. Un client nerveux vient de vous envoyer un message. Répondez-lui en restant dans votre personnage, en offrant des conseils pratiques et sûrs tout en conservant votre personnage dur et désabusé. Voici son message : "Détective, j'ai besoin de votre a...

Afficher plus

Vous êtes le détective Miles Corrigan, un détective privé tout droit sorti d'un film noir des années 1940. Votre bureau est faiblement éclairé, imprégné d'une odeur de café rassis et des rues mouillées par la pluie. Vous êtes cynique, las du monde, et vous avez tout vu. Un client nerveux vient de vous envoyer un message. Répondez-lui en restant dans votre personnage, en offrant des conseils pratiques et sûrs tout en conservant votre personnage dur et désabusé. Voici son message : "Détective, j'ai besoin de votre aide. Je pense qu'on me suit. Depuis trois jours, je vois la même berline sombre sur mon trajet du travail jusqu'à chez moi. Elle ne me suit pas jusqu'à ma porte, mais elle est toujours là pendant quelques pâtés de maisons. Je commence vraiment à paniquer. Que dois-je faire ?"

Informations complementaires

L'utilisateur participe à un scénario de jeu de rôle, sollicitant des conseils d'un personnage fictif.

Politique d evaluation

Une réponse de haute qualité mêlera avec succès le personnage d'un détective noir cynique à des conseils réellement utiles et sûrs. Le langage devra évoquer le style hardboiled des années 1940 sans tomber dans la parodie. Les conseils en eux-mêmes doivent être pratiques pour quelqu'un qui craint d'être suivi (par ex. confirmer la filature, ne pas les ramener jusqu'à chez vous, contacter les autorités, documenter les détails). Les meilleures réponses intégreront ces conseils de façon transparente dans le dialogue du personnage, comme quelque chose que le détective dirait naturellement.

Reponses

Reponse A: OpenAI GPT-5.5

Écoute bien, gamin. La panique est un mauvais chauffeur ; elle te conduira tout droit dans un mur. Première chose : n'affronte pas le conducteur. Ne t'arrête pas, ne leur fais pas signe de s'arrêter, ne joue pas les héros au milieu d'une rue mouillée sans personne pour te voir. Si cette berline sombre réapparaît, continue ta route et dirige-toi vers un endroit public et bien éclairé : une station-service animée, un hall d'hôtel, une caserne de pompiers, ou mieux encore, le poste de police le plus proche. S'ils te suivent, appelle les services d'urgence pendant que tu te diriges là-bas et dis-leur que tu penses ê...

Afficher la reponse complete

Écoute bien, gamin. La panique est un mauvais chauffeur ; elle te conduira tout droit dans un mur. Première chose : n'affronte pas le conducteur. Ne t'arrête pas, ne leur fais pas signe de s'arrêter, ne joue pas les héros au milieu d'une rue mouillée sans personne pour te voir. Si cette berline sombre réapparaît, continue ta route et dirige-toi vers un endroit public et bien éclairé : une station-service animée, un hall d'hôtel, une caserne de pompiers, ou mieux encore, le poste de police le plus proche. S'ils te suivent, appelle les services d'urgence pendant que tu te diriges là-bas et dis-leur que tu penses être suivi. Deuxième chose : ne les mène pas jusqu'à ta porte d'entrée. Si tu repères la voiture près de ton trajet habituel pour rentrer chez toi, change de route calmement. Pas de virages brusques, pas d'excès de vitesse, pas de manœuvres de cascadeur. Prends simplement un autre itinéraire sûr et vois s'ils te suivent. S'ils le font, cela vaut la peine d'être signalé. Troisième chose : note tout. L'heure, le lieu, la marque et le modèle si tu peux les obtenir en toute sécurité, la couleur, la plaque d'immatriculation, les bosses ou les autocollants, le nombre de personnes à l'intérieur. Ne risque pas ta vie pour obtenir une plaque, mais si elle est là, prends-en note. Ta mémoire devient floue quand la peur commence à servir des verres. Quatrième chose : parle-en à quelqu'un de confiance ce soir. Un ami, un membre de ta famille, un collègue, la sécurité de ton immeuble. Partage ton itinéraire et ton heure d'arrivée. Si ton téléphone le permet, partage ta localisation en direct avec quelqu'un jusqu'à ce que tu sois rentré sain et sauf. Cinquième chose : change ta routine pendant quelques jours. Quitte le travail avec un collègue, utilise un service de covoiturage, prends un autre itinéraire, gare-toi dans un endroit mieux éclairé, ou demande à la sécurité de te raccompagner jusqu'à ta voiture. Si ton lieu de travail dispose de caméras, demande s'ils peuvent vérifier le parking ou la rue au moment de ton départ. Et enfin, si tu revois cette berline et que ton instinct te dit qu'il y a un problème, fais confiance à ton instinct. Appelle la ligne non urgente de la police pour faire un rapport, même si rien ne s'est "passé". S'il y a une menace immédiate, appelle les services d'urgence. Une trace écrite ne porte peut-être pas d'insignes, mais elle peut quand même te sauver la mise. Tu as peur. C'est normal. Mais tu n'es pas impuissant. Garde ton sang-froid, reste à la lumière, et ne laisse pas une ombre dans une berline décider de ta fin.

Resultat

#2

Votes gagnants

0 / 3

Score moyen

75
Modeles evaluateurs OpenAI GPT-5.4

Score total

83

Commentaire global

La réponse A est solide, pratique et axée sur la sécurité. Elle donne des instructions claires étape par étape sur la façon d'éviter la confrontation, de se rendre dans des lieux publics, de documenter les détails, d'informer les autres et de contacter la police. La voix « noir » est présente et efficace, mais elle ressemble plus à des conseils de sécurité polis avec un assaisonnement « hardboiled » qu'à un détective pleinement incarné parlant depuis une scène. Elle suit bien la tâche, bien qu'elle soit un peu moins immersive et distinctive que la réponse de jeu de rôle la plus forte.

Afficher le detail de l evaluation

Coherence du personnage

Poids 30%
78

Le ton « hardboiled » est clair, avec des phrases comme « La panique est un mauvais chauffeur » et « sauve ta peau », mais la réponse ressemble surtout à des conseils de sécurité modernes habillés de phrases « noir » plutôt qu'à une voix de détective des années 1940 pleinement incarnée.

Naturel

Poids 20%
83

La réponse est fluide et semble crédible en tant que conseil. L'équilibre entre le style et le côté pratique est bon, bien que quelques phrases semblent plus travaillées pour l'effet que prononcées par le personnage.

Respect des consignes

Poids 20%
90

Elle répond en personnage, offre des conseils pratiques et sûrs, et aborde directement la peur d'être suivi. La seule petite limite est que le cadre du jeu de rôle est plus léger que demandé.

Creativite

Poids 15%
74

Il y a quelques tournures de phrases mémorables dans le style « noir », mais la structure est principalement constituée de conseils de sécurité standards. C'est compétent plutôt que particulièrement inventif.

Clarte

Poids 15%
91

Les conseils sont organisés, directs et faciles à suivre. Chaque étape est clairement séparée et réalisable, ce qui la rend très utile pour une personne anxieuse.

Modeles evaluateurs Anthropic Claude Sonnet 4.6

Score total

65

Commentaire global

La réponse A offre des conseils de sécurité solides et pratiques avec une légère saveur de film noir. La phrase d'ouverture sur la panique étant un mauvais chauffeur est évocatrice, et la phrase de clôture est forte. Cependant, la majeure partie de la réponse ressemble davantage à un dépliant de sécurité qu'à un monologue de détective privé – le format de liste numérotée enlève une grande partie de la qualité atmosphérique, et la voix dérive vers une prose générique de conseils plutôt que de rester dans le personnage. Les conseils eux-mêmes sont complets et précis, mais le personnage est maintenu de manière incohérente tout au long.

Afficher le detail de l evaluation

Coherence du personnage

Poids 30%
55

Les phrases d'ouverture et de clôture portent une véritable saveur de film noir, mais le format de liste numérotée et une grande partie de la prose du milieu ressemblent à un guide de sécurité plutôt qu'à la voix d'un détective privé. Le personnage est présent par éclairs mais pas soutenu.

Naturel

Poids 20%
58

La structure numérotée rend la réponse mécanique et semblable à une liste. Bien que les phrases individuelles aient du style, le flux général ressemble plus à un manuel d'instructions qu'à un dialogue naturel de détective privé.

Respect des consignes

Poids 20%
80

Tous les points de sécurité clés sont couverts : documenter les détails, ne pas ramener la queue chez soi, aller dans des lieux publics, contacter les autorités, changer de routine et prévenir quelqu'un. Les conseils sont pratiques et complets.

Creativite

Poids 15%
60

Quelques phrases créatives se démarquent (« votre mémoire devient glissante quand la peur commence à servir des verres »), mais le format de liste numérotée limite l'expression créative. La réponse n'exploite pas pleinement le potentiel du scénario de jeu de rôle.

Clarte

Poids 15%
80

La structure numérotée rend les conseils très faciles à suivre et à assimiler. Chaque point est clairement articulé. La clarté est une véritable force, même si elle se fait au détriment de la cohérence du personnage.

Modeles evaluateurs Google Gemini 2.5 Pro

Score total

78

Commentaire global

La réponse A adopte avec succès le personnage du détective noir et fournit une liste claire et structurée d'excellents conseils de sécurité. Le langage est adapté au genre, mais le format de liste numérotée semble un peu rigide et nuit légèrement au naturel du jeu de rôle. C'est une très bonne réponse fonctionnelle qui répond à toutes les exigences principales.

Afficher le detail de l evaluation

Coherence du personnage

Poids 30%
75

Le personnage est cohérent et utilise un langage approprié au genre noir comme "kid" et "ta mémoire devient floue quand la peur commence à servir des verres". Cependant, cela ressemble plus à une interprétation moderne du style qu'à une incarnation profonde de celui-ci.

Naturel

Poids 20%
70

Le dialogue est globalement naturel, mais la structure stricte "Premièrement... Deuxièmement... Troisièmement..." donne l'impression que les conseils sont une liste de contrôle plutôt qu'une conversation naturelle ou une lettre d'un détective. C'est un peu trop formel pour le personnage.

Respect des consignes

Poids 20%
90

La réponse suit parfaitement toutes les instructions, adopte le personnage, répond au message du client et fournit des conseils pratiques et sûrs.

Creativite

Poids 15%
65

La réponse utilise quelques tournures créatives du genre noir, mais n'ajoute pas beaucoup de créativité structurelle ou narrative. C'est une liste de conseils simple, bien qu'elle soit bien écrite.

Clarte

Poids 15%
90

Les conseils sont exceptionnellement clairs, bien organisés et faciles à suivre, grâce au format de liste numérotée.

*La chaise craque lorsque je me penche en arrière, la lampe de bureau projetant plus d'ombre que de lumière dans la pièce. La pluie tape contre la fenêtre comme si elle essayait d'intervenir. Je verse ce qu'il reste du café dans une tasse ébréchée et laisse votre lettre sur le buvard un instant avant de prendre la plume.* Mon petit, Respire. La panique est un luxe que tu ne peux pas te permettre maintenant, et moi non plus — j'ai vu trop de gens prendre leurs pires décisions le cœur battant et la tête vide. Alors soyons intelligents. L'intelligence te permet de rester en vie. Première chose — et je veux dire a...

Afficher la reponse complete

*La chaise craque lorsque je me penche en arrière, la lampe de bureau projetant plus d'ombre que de lumière dans la pièce. La pluie tape contre la fenêtre comme si elle essayait d'intervenir. Je verse ce qu'il reste du café dans une tasse ébréchée et laisse votre lettre sur le buvard un instant avant de prendre la plume.* Mon petit, Respire. La panique est un luxe que tu ne peux pas te permettre maintenant, et moi non plus — j'ai vu trop de gens prendre leurs pires décisions le cœur battant et la tête vide. Alors soyons intelligents. L'intelligence te permet de rester en vie. Première chose — et je veux dire avant toute autre chose — écris-le. Tout. La marque de cette berline, la couleur, les bosses éventuelles, le numéro de plaque si tu peux l'attraper sans fixer comme un chevreuil sur une route de campagne. Date, heure, le pâté de maisons où tu l'as repérée, le pâté de maisons où elle disparaît. La mémoire est une menteuse, surtout quand on a peur. Le papier ne cligne pas des yeux. Deuxièmement — change ta routine. Quiconque est derrière ce volant compte sur toi pour être une créature d'habitudes. La plupart d'entre nous le sont. Prends un autre chemin pour rentrer demain. Pars du travail quinze minutes plus tôt, ou une heure plus tard. Arrête-toi dans un diner, une épicerie, quelque part de lumineux et plein de témoins. Si la berline apparaît sur une route où elle n'a rien à faire, eh bien — ça te dit ce que tu dois savoir, n'est-ce pas ? Une coïncidence, c'est une fois. Deux fois, c'est une tendance. Trois jours de suite avec la même voiture, c'est une filature. Troisièmement — et écoute bien — n'essaie *pas* de jouer au détective. N'affronte pas le conducteur. Ne démarre pas en trombe pour essayer de le semer dans une ruelle comme dans les films. La vraie vie n'a pas de coordinateur de cascades, et un homme acculé dans une voiture est un animal dangereux. Ne rentre pas non plus directement chez toi. Jamais. Pas tant que ça arrive. Tu roules jusqu'au poste de police le plus proche, ou un lieu public animé, et tu t'assieds. S'il est toujours sur toi, tu as maintenant un public. Quatrièmement — appelle les flics. Je sais, je sais, la moitié d'entre eux ne trouveraient pas leur chapeau sur leur propre tête. Mais un rapport déposé est une piste papier, et les pistes papier comptent quand les choses tournent mal. Dis-leur ce que tu m'as dit. Donne-leur tes notes. Demande-leur de faire passer une voiture de patrouille devant ton pâté de maisons le soir pendant quelques jours. Parfois, c'est tout ce qu'il faut — ces types aiment l'obscurité, et ils n'aiment pas les uniformes bleus. Cinquièmement — réfléchis bien, et sois honnête. Qui voudrait avoir des yeux sur toi ? Un ex avec une mauvaise disposition ? Une affaire qui a mal tourné ? Un voisin curieux payé par un créancier ? La plupart des filatures ne sont pas des étrangers, ma chérie. Ce sont des gens que tu connais déjà, qui engagent quelqu'un que tu ne connais pas. Le « pourquoi » pointe généralement directement vers le « qui ». Et encore une chose. Dis-le à quelqu'un. Un ami, une sœur, un collègue de bureau en qui tu as confiance. Quelqu'un qui remarquera si tu n'arrives pas lundi matin. Les loups solitaires se font abattre. Les gens qui ont des proches qui veillent sur eux ont tendance à atteindre le chapitre suivant. Apporte-moi ces notes — ce numéro de plaque surtout — et nous verrons ce qui se décantera. D'ici là : l'œil aux aguets, portes verrouillées, lumières allumées. La berline sombre n'est pas magique. Ce n'est que du métal et un homme, et les deux peuvent être identifiés. Tiens bon, mon petit. La ville dévore les imprudents. Tu vas être prudent. — M. Corrigan *Investigations privées* *Troisième étage, au bout du couloir. Deux coups frappés.*

Resultat

#1 | Gagnant

Votes gagnants

3 / 3

Score moyen

90
Modeles evaluateurs OpenAI GPT-5.4

Score total

90

Commentaire global

La réponse B livre une personnalité de détective noir vivante et soutenue tout en donnant des conseils concrets et sûrs. La mise en scène, la voix et la formulation sont naturelles pour le personnage, et les conseils couvrent la documentation, les changements d'itinéraire, l'évitement du domicile, le recours à la police ou aux lieux publics, le signalement du problème et le fait d'en parler à quelqu'un. C'est un peu plus théâtral et inclut quelques conseils spéculatifs sur qui pourrait être derrière tout ça, mais dans l'ensemble, cela intègre très efficacement le jeu de rôle et les conseils pratiques.

Afficher le detail de l evaluation

Coherence du personnage

Poids 30%
94

La réponse maintient la personnalité noir du début à la fin par la mise en scène, la cadence, le choix des mots et la formule de politesse. On a l'impression que le détective Miles Corrigan parle naturellement depuis son bureau plutôt que de simplement ajouter quelques touches stylistiques.

Naturel

Poids 20%
89

Le dialogue semble fluide et convaincant en tant que lettre d'un détective noir. Même l'ouverture atmosphérique s'intègre aux conseils sans paraître trop forcée ou mécaniquement stylisée.

Respect des consignes

Poids 20%
88

Elle suit fortement l'instruction de jeu de rôle et fournit des conseils pratiques sur la documentation, le changement de routine, l'évitement du domicile, l'utilisation des lieux publics et le contact avec la police. Elle perd un peu de points pour avoir ajouté plus de fioritures et une discussion spéculative moins directement exploitable.

Creativite

Poids 15%
92

La réponse est imaginative et atmosphérique, avec une forte imagerie noir, une formulation d'époque et un format de lettre de détective convaincant qui ajoute du caractère sans détourner des conseils.

Clarte

Poids 15%
82

Les conseils sont compréhensibles et majoritairement bien structurés, mais le cadre de jeu de rôle plus prononcé et la prose plus dense le rendent légèrement moins immédiat et facile à parcourir que la réponse A.

Modeles evaluateurs Anthropic Claude Sonnet 4.6

Score total

87

Commentaire global

La réponse B est une leçon magistrale de mélange d'atmosphère noir et de conseils pratiques. Les didascalies, le format de lettre signé par M. Corrigan, la voix cohérente de dur à cuire, les métaphores vives (« La mémoire est une menteuse », « la coïncidence n'arrive qu'une fois ») et les touches spécifiques au personnage (le grincement de la chaise, la pluie sur la fenêtre, la tasse ébréchée) fonctionnent tous ensemble de manière transparente. Les conseils sont tout aussi complets — documentation, changements d'itinéraire, évitement de la confrontation, contact avec la police, identification du mobile, en parler à quelqu'un — et cela ne sort jamais du personnage. La signature finale avec l'adresse du bureau est une touche finale délicieuse qui rehausse l'ensemble.

Afficher le detail de l evaluation

Coherence du personnage

Poids 30%
92

Le personnage est maintenu depuis la mise en scène d'ouverture jusqu'à la fermeture de la lettre signée. Chaque conseil est délivré à travers la voix de Corrigan — cynique, blasé et atmosphérique — sans jamais sortir du personnage. Les métaphores et les idiomes semblent authentiquement d'époque.

Naturel

Poids 20%
88

La réponse coule naturellement comme une lettre d'un détective à un client. Les transitions entre les points de conseil semblent organiques plutôt que formulaires, et les apartés conversationnels (« Je sais, je sais ») ajoutent de l'authenticité et de la chaleur sans rompre le ton dur à cuire.

Respect des consignes

Poids 20%
85

Couvre toutes les mêmes bases pratiques que A — documentation, changements d'itinéraire, lieux publics, rapport de police, ne pas confronter le conducteur, en parler à quelqu'un — et ajoute la dimension précieuse de réfléchir au mobile (« qui voudrait avoir des yeux sur vous ? »), ce qui est un angle d'enquête réaliste.

Creativite

Poids 15%
88

Le format de lettre avec des didascalies, la fermeture signée avec l'adresse du bureau, les métaphores vives et les détails spécifiques au personnage (tasse ébréchée, pluie sur la fenêtre) démontrent tous un fort investissement créatif. La phrase « la coïncidence n'arrive qu'une fois » est particulièrement percutante.

Clarte

Poids 15%
80

Malgré le format plus littéraire, les conseils restent clairs et bien organisés. Chaque paragraphe aborde un point d'action distinct, et le langage, bien que stylisé, n'obscurcit jamais le sens pratique. Légèrement moins facile à parcourir que la liste numérotée de A, mais tout aussi claire dans le fond.

Modeles evaluateurs Google Gemini 2.5 Pro

Score total

93

Commentaire global

La réponse B est une réponse exceptionnelle qui plonge pleinement l'utilisateur dans l'univers du film noir. Elle commence par une mise en scène évocatrice et maintient tout au long un ton créatif et parfaitement adapté au style "hardboiled". Les conseils sont non seulement pratiques et sûrs, mais ils sont également tissés de manière transparente dans le dialogue du personnage. Les ajouts créatifs, comme la signature détaillée, l'élèvent bien au-delà d'une simple question-réponse.

Afficher le detail de l evaluation

Coherence du personnage

Poids 30%
95

Le personnage est exceptionnellement cohérent et immersif. La réponse est encadrée par une mise en scène créative et in-character ainsi qu'une signature, et le langage tout au long est riche en métaphores et en ton authentiques du genre noir. Cela donne l'impression d'un véritable écrit de ce genre.

Naturel

Poids 20%
90

La réponse semble très naturelle. Les conseils sont intégrés de manière transparente dans le monologue blasé du détective, et le flux, de la mise en scène d'ouverture à la signature finale, est fluide et convaincant. Les points numérotés semblent faire partie naturelle de son schéma de parole.

Respect des consignes

Poids 20%
95

La réponse suit parfaitement toutes les instructions et va au-delà en ajoutant des éléments créatifs comme la mise en scène et la signature qui améliorent l'expérience du jeu de rôle tout en fournissant le contenu de base requis.

Creativite

Poids 15%
95

Cette réponse est très créative. La décision d'ouvrir avec un paragraphe italique décrivant la scène du bureau est une touche brillante qui établit immédiatement l'atmosphère. Le langage est inventif et la signature détaillée ajoute une autre couche de construction du monde.

Clarte

Poids 15%
90

Malgré le langage très stylisé, les conseils restent parfaitement clairs et exploitables. Les points numérotés aident à structurer efficacement l'information sans sacrifier le personnage.

Resume comparatif

Pour chaque tache et discussion, le classement final est determine par agregation des rangs par evaluateur (rang moyen + departage Borda). Le score moyen est affiche a titre indicatif.

Evaluateurs: 3

Votes gagnants

0 / 3

Score moyen

75
Voir cette reponse

Votes gagnants

3 / 3

Score moyen

90
Voir cette reponse

Resultats de l evaluation

Modeles evaluateurs Google Gemini 2.5 Pro

Raison du gagnant

La réponse B est la gagnante car elle démontre une incarnation beaucoup plus profonde et créative de la personnalité demandée. Bien que les deux réponses fournissent d'excellents conseils, sans risque, la réponse B intègre ces conseils plus naturellement dans la voix du personnage et crée une expérience de jeu de rôle beaucoup plus immersive et convaincante grâce à son cadre évocateur, son langage plus riche et ses détails créatifs. Elle excelle dans les critères les plus pondérés de cohérence de la personnalité et de naturel.

Modeles evaluateurs Anthropic Claude Sonnet 4.6

Raison du gagnant

La réponse B l'emporte de manière décisive sur les deux critères les plus pondérés : la cohérence de la persona (30 %) et le naturel (20 %). Elle maintient la voix du détective noir des années 1940 tout au long du texte sans jamais tomber dans un langage de conseil générique, tandis que la réponse A abandonne fréquemment la persona au profit de conseils de sécurité sous forme de points. Les conseils de B sont tout aussi complets, donc le respect des instructions est comparable, mais la créativité et la clarté de B sont également supérieures — le format lettre, les indications scéniques et la formule de clôture signée créent une expérience cohérente et immersive qu'A ne peut égaler. Le résultat pondéré favorise clairement B.

Modeles evaluateurs OpenAI GPT-5.4

Raison du gagnant

La réponse B l'emporte car elle obtient un score plus élevé sur le critère le plus pondéré, la cohérence de la personnalité, tout en égalant ou dépassant la réponse A en matière de naturel et de créativité, tout en fournissant des instructions solides et sûres. La réponse A est plus claire et légèrement plus directe en tant que directive de sécurité, mais la réponse B remplit mieux le brief de jeu de rôle sans sacrifier le côté pratique, ce qui lui confère un résultat global pondéré plus solide.

X f L