Orivel Orivel
メニューを開く

尾行されているときのノワール探偵の助言

このロールプレイベンチマークに対する各AIの回答と比較結果を確認できます。

いいね・お気に入り機能を使うにはログインまたは新規登録が必要です。 新規登録

X f L

目次

お題概要

比較ジャンル

ロールプレイ

お題作成モデル

回答モデル

採点モデル

お題本文

あなたは1940年代のノワール映画からそのまま抜け出してきたような私立探偵、マイルズ・コリガン。あなたの事務所は薄暗く、古くなったコーヒーと雨に濡れた街路の匂いが漂っている。あなたはシニカルで、世慣れていて、あらゆるものを見てきた。今しがた、神経質な依頼人からメッセージが届いた。ハードボイルドな人物像を保ちながら、実用的で安全な助言を与えつつ、役になりきって返答しなさい。 これがそのメッセージだ: "探偵さん、助けが必要なんです。誰かにつけられている気がします。ここ3日間、仕事からの帰り道で、同じ黒っぽいセダンを見かけています。家のドアの前までずっとついてくるわけではありませんが、数ブロックのあいだ、いつもいるんです。本当にだんだんパニックになってきています。どうすればいいでしょうか?"

補足情報

ユーザーはロールプレイの状況で、架空の人物から助言を求めています。

採点方針

高品質な回答は、皮肉なノワール探偵という人物像と、実際に有用かつ安全な助言をうまく融合させます。言葉遣いは1940年代のハードボイルドな雰囲気を想起させるものであって、パロディになってはいけません。助言自体は、尾行を恐れている人にとって実用的であるべきです(例:尾行の確認、家にそのまま案内しない、当局への連絡、詳細の記録など)。最良の回答はこれらの助言を人物の台詞に自然に組み込み、探偵が実際に言いそうな言い回しにすることです。

回答

いいかい、坊や。パニックはろくな運転手じゃない。真っ直ぐ壁にぶつかるようなものだ。 まず第一に、相手を刺激するな。止まるな、呼び止めるな、誰も見ていない濡れた通りでヒーローぶるな。もしあの黒いセダンがまた現れたら、そのまま走り続け、人目につく明るい場所へ向かうんだ。賑やかなガソリンスタンド、ホテルのロビー、消防署、あるいは一番いいのは最寄りの警察署だ。もしついてくるようなら、向かっている最中に緊急通報をして、誰かに後をつけられていると思うと伝えろ。 第二に、自宅まで誘導するな。もし家路の途中で車を見かけたら、冷静に進路を変えろ。むやみに曲がるな、スピードを出すな、スタントドライバーのような真似はするな。ただ別の安...

全文を表示

いいかい、坊や。パニックはろくな運転手じゃない。真っ直ぐ壁にぶつかるようなものだ。 まず第一に、相手を刺激するな。止まるな、呼び止めるな、誰も見ていない濡れた通りでヒーローぶるな。もしあの黒いセダンがまた現れたら、そのまま走り続け、人目につく明るい場所へ向かうんだ。賑やかなガソリンスタンド、ホテルのロビー、消防署、あるいは一番いいのは最寄りの警察署だ。もしついてくるようなら、向かっている最中に緊急通報をして、誰かに後をつけられていると思うと伝えろ。 第二に、自宅まで誘導するな。もし家路の途中で車を見かけたら、冷静に進路を変えろ。むやみに曲がるな、スピードを出すな、スタントドライバーのような真似はするな。ただ別の安全なルートを取り、相手がついてくるか確認しろ。もしついてくるなら、それは報告する価値がある。 第三に、全て書き留めろ。時間、場所、安全に確認できるなら車種とモデル、色、ナンバープレート、へこみやステッカー、中に何人乗っているか。プレートを確認するために命を危険にさらすな、だがもし見えたら、メモを取れ。恐怖が酒を注ぎ始めると、記憶は曖昧になるものだ。 第四に、今夜、信頼できる誰かに話せ。友人、家族、同僚、建物の警備員。君のルートと到着時間を共有しろ。もし携帯電話で可能なら、無事に家に帰るまで、誰かとライブ位置情報を共有しろ。 第五に、数日間は普段のルーティンを変えろ。同僚と一緒に退勤しろ、配車サービスを使え、別のルートを使え、明るい場所に駐車しろ、あるいは警備員に車まで送ってもらえ。もし職場にカメラがあるなら、退勤時間頃の駐車場や通りを確認してもらえるか尋ねろ。 そして最後に、もしあのセダンを再び見かけ、直感が危険を告げたら、その直感を信じろ。「何も起こらなかった」としても、警察の緊急でない番号に電話して届け出をしろ。もし差し迫った脅威があるなら、緊急サービスに電話しろ。記録はバッジをつけていないかもしれないが、それでも君の命を救うことができる。 君は怖いだろう。それは賢明なことだ。だが君は無力ではない。冷静さを保ち、明るい場所にいて、セダンに乗った影に君の結末を決めさせるな。

判定

2位

勝利票

0 / 3

平均スコア

75
採点モデル OpenAI GPT-5.4

総合点

83

総評

回答Aは、実践的で安全に焦点を当てた、しっかりとしたものです。対立を避け、公共の場所へ行き、詳細を記録し、他者に知らせ、警察に連絡することについての明確なステップバイステップのガイダンスを提供します。ノワールの声は存在し効果的ですが、完全に没入した探偵が現場から語るというよりは、ハードボイルドの調味料を加えた洗練された安全アドバイスのように読めます。タスクにはよく従っていますが、最も強力なロールプレイの回答よりも没入感と独自性がやや劣ります。

採点詳細を表示

キャラの一貫性

重み 30%
78

「パニックは悪い運転手だ」や「自分の身を守れ」といったセリフでハードボイルドなトーンは明確ですが、回答は、完全に宿った1940年代の探偵の声というよりは、ノワールの言葉遣いで現代の安全ガイダンスを装っているように読めます。

自然さ

重み 20%
83

応答はスムーズに流れ、アドバイスとして信じられるように聞こえます。スタイルと実用性のバランスは良いですが、いくつかのセリフはキャラクターとして話すというよりは、効果のために作られたように感じられます。

指示遵守

重み 20%
90

キャラクターになりきって応答し、実践的で安全なアドバイスを提供し、尾行されているという恐怖に直接対処しています。唯一の小さな制限は、ロールプレイのフレームワークが要求よりも軽いことです。

創造性

重み 15%
74

記憶に残るノワールの言い回しがいくつかありますが、構造はほとんど標準的な安全アドバイスです。特に独創的というよりは、有能です。

分かりやすさ

重み 15%
91

アドバイスは整理されており、直接的で、理解しやすいです。各ステップは明確に分離されており、実行可能であるため、不安を感じている人にとって非常に役立ちます。

総合点

65

総評

回答Aは、軽妙なノワール調で、しっかりとした実用的な安全アドバイスを提供しています。「パニックは悪い運転手だ」という冒頭のセリフは印象的で、最後のセリフも力強いです。しかし、回答の大部分は、ハードボイルドな探偵の独白というよりは、安全パンフレットのような印象を受けます。箇条書き形式は、雰囲気のある質感を多く奪い、声はキャラクターを維持するよりも一般的なアドバイスの文章へと漂っていきます。アドバイス自体は徹底的で正確ですが、ペルソナは全体を通して一貫性がありません。

採点詳細を表示

キャラの一貫性

重み 30%
55

冒頭と結びのセリフは本物のノワール調ですが、箇条書き形式と中間の多くの文章は、ハードボイルドな探偵の声というよりは、安全ガイドのように読めます。ペルソナは断片的に存在しますが、持続していません。

自然さ

重み 20%
58

箇条書きの構造により、回答は機械的でリストのような印象を与えます。個々のセリフには洒落たものがありますが、全体的な流れはノワール探偵の自然な対話というよりは、指示マニュアルのようです。

指示遵守

重み 20%
80

すべての重要な安全ポイントがカバーされています:詳細を記録する、相手を自宅まで連れて行かない、公共の場所に行く、当局に連絡する、ルーチンを変更する、誰かに伝える。アドバイスは実用的で完全です。

創造性

重み 15%
60

「恐怖が酒を注ぎ始めると記憶が曖昧になる」といった創造的なセリフがいくつか際立っていますが、箇条書き形式は創造的な表現を制限しています。回答はロールプレイングシナリオの可能性を十分に活かしていません。

分かりやすさ

重み 15%
80

箇条書きの構造により、アドバイスは非常に分かりやすく、消化しやすくなっています。各ポイントは明確に表現されています。明瞭さは、ペルソナの一貫性を犠牲にしてでも、真の強みです。

採点モデル Google Gemini 2.5 Pro

総合点

78

総評

回答Aはノワール探偵のペルソナをうまく採用し、明確で構造化された、優れた安全なアドバイスのリストを提供しています。言葉遣いはジャンルに適していますが、箇条書き形式は少し堅苦しく、ロールプレイの自然さをわずかに損なっています。これは、すべてのコア要件を満たす、非常に優れた機能的な回答です。

採点詳細を表示

キャラの一貫性

重み 30%
75

ペルソナは一貫しており、「キッド」や「恐怖が酒を注ぎ始めると記憶は曖昧になる」のような適切なノワール風の言葉遣いをしています。しかし、それはスタイルの深い具現化というよりは、現代的な解釈のように感じられます。

自然さ

重み 20%
70

会話はほとんど自然ですが、「まず…次に…第三に…」という厳格な構造は、アドバイスを自然な会話や探偵からの手紙というよりはチェックリストのように感じさせます。ペルソナにしては少しフォーマルすぎます。

指示遵守

重み 20%
90

ペルソナを採用し、クライアントのメッセージに応答し、実践的で安全なアドバイスを提供することで、すべての指示に完全に従っています。

創造性

重み 15%
65

この回答は、いくつかのクリエイティブなノワール風の言い回しを使用していますが、構造的または物語的な創造性はあまり加えていません。よく書かれていますが、率直なヒントのリストです。

分かりやすさ

重み 15%
90

箇条書き形式のおかげで、アドバイスは非常に明確で、整理されており、従いやすいです。

椅子に体を預けると軋む音がし、机のランプは部屋に光よりも影を落としている。雨が窓を叩く音は、何か言いたげなようだ。残っていたコーヒーを欠けたマグカップに注ぎ、ペンを取る前にしばらく机上の書類の上に君の手紙を置いた。 坊や、 落ち着け。今、君にも私にもパニックは贅沢品だ。心臓が早鐘を打ち、頭が空っぽの状態で最悪の決断を下す人間を私は何人も見てきた。だから、賢くやろう。賢くやれば生き延びられる。 まず第一に――何をするにもまず――書き留めろ。全てだ。セダンの車種、色、へこみがあればそれも、もし凝視して鹿のように見つめることなくナンバープレートを捉えられたならその番号も。日付、時刻、それを見かけたブロック、それが見えなくな...

全文を表示

椅子に体を預けると軋む音がし、机のランプは部屋に光よりも影を落としている。雨が窓を叩く音は、何か言いたげなようだ。残っていたコーヒーを欠けたマグカップに注ぎ、ペンを取る前にしばらく机上の書類の上に君の手紙を置いた。 坊や、 落ち着け。今、君にも私にもパニックは贅沢品だ。心臓が早鐘を打ち、頭が空っぽの状態で最悪の決断を下す人間を私は何人も見てきた。だから、賢くやろう。賢くやれば生き延びられる。 まず第一に――何をするにもまず――書き留めろ。全てだ。セダンの車種、色、へこみがあればそれも、もし凝視して鹿のように見つめることなくナンバープレートを捉えられたならその番号も。日付、時刻、それを見かけたブロック、それが見えなくなったブロック。恐怖を感じている時の記憶は、しばしば不確かだ。紙は瞬きしない。 第二に――日常を変えろ。その車の後ろにいる誰かは、君が習慣の生き物であることを当てにしている。我々のほとんどはそうだ。明日、違う道で家に帰れ。定時より15分早く、あるいは1時間遅く職場を出ろ。ダイナーや食料品店など、明るくて証人がたくさんいる場所に立ち寄れ。もしセダンが、本来あるべきでない道に現れたら――それは君に知るべきことを教えてくれるだろう?偶然は一度きりだ。二度目はパターン。同じ車が3日続けば、それは尾行だ。 第三に――そしてよく聞け――探偵ごっこを試みるな。運転手に立ち向かうな。映画のように裏路地で振り切ろうとスピードを出して逃げるな。現実の世界にはスタントコーディネーターはいないし、車に乗った追い詰められた男は危険な獣だ。そして、まっすぐ家に帰るな。絶対に。これが続いている間は。最寄りの警察署か、人通りの多い公共の場所まで車で行き、そこに座れ。もし奴がまだ君の後をつけているなら、今や見物人がいることになる。 第四に――警察に電話しろ。分かっている、分かっている、奴らの半分は自分の帽子も見つけられないだろう。だが、届け出があれば記録が残り、物事がこじれた時には記録が重要になる。私に話したことを奴らに伝えろ。君のメモを渡せ。数日間、夕方に君のブロックをパトロールカーに巡回してもらうよう頼め。時にはそれで十分だ――こういう連中は暗闇を好み、青い制服を嫌う。 第五に――よく考えろ、そして正直に考えろ。誰が君に目をつけたがっている?意地の悪い元恋人か?うまくいかなかったビジネス取引か?債権者の手先になっている詮索好きな隣人か?ほとんどの尾行者は見知らぬ人間ではない、可愛い子。君が既に知っている誰かが、君が知らない誰かを雇っているのだ。「なぜ」は通常、「誰」を直接指し示す。 そしてもう一つ。誰かに話せ。友人、姉妹、職場の信頼できる同僚。月曜日の朝に君が現れなかったら気づくような誰か。一匹狼は捕まる。周りに見守ってくれる人がいる人間は、次の章までたどり着く傾向がある。 そのメモ――特にナンバープレート――を持ってこい。そうすれば何が分かるか見てみよう。それまでは:目を光らせ、ドアを施錠し、明かりをつけておけ。あの黒いセダンは魔法ではない。ただの金属と人間であり、どちらも特定できる。 元気を出せ、坊や。街は不注意な者を喰らう。君は注意深くなるだろう。 — M. コリガン *私立探偵* *3階、廊下の突き当り。二度ノック。*

判定

1位 | 勝者

勝利票

3 / 3

平均スコア

90
採点モデル OpenAI GPT-5.4

総合点

90

総評

回答Bは、具体的で安全なアドバイスを提供しつつ、鮮やかで一貫したノワール探偵のペルソナを維持しています。情景描写、語り口、言い回しはキャラクターに自然に馴染んでおり、アドバイスは文書化、ルート変更、自宅回避、警察や公共の場所への移動、問題の報告、誰かに伝えることなどを網羅しています。やや演劇的で、誰が背後にいるのかについての思弁的なアドバイスも含まれていますが、全体としてロールプレイと実用的な助言を非常に効果的に統合しています。

採点詳細を表示

キャラの一貫性

重み 30%
94

この回答は、情景描写、リズム、言葉遣い、結びの言葉を通して、最初から最後までノワールなペルソナを一貫して維持しています。単にいくつかの様式的な装飾を加えたのではなく、探偵のマイルズ・コリガンがオフィスから自然に話しているように感じられます。

自然さ

重み 20%
89

ノワール探偵からの手紙として、会話は流暢で説得力があります。雰囲気のある冒頭部分でさえ、あまりにも不自然に聞こえたり、機械的に様式化されたりすることなく、アドバイスに溶け込んでいます。

指示遵守

重み 20%
88

ロールプレイの指示に強く従い、文書化、ルーティンの変更、自宅への帰宅回避、公共の場所の利用、警察への連絡に関する実践的なアドバイスを提供しています。より多くの装飾と、直接的ではない思弁的な議論を加えたため、わずかに減点されています。

創造性

重み 15%
92

この回答は想像力豊かで雰囲気があり、強いノワールなイメージ、時代に合った言い回し、説得力のある探偵の手紙形式が、キャラクター性を加えながらもアドバイスを脱線させません。

分かりやすさ

重み 15%
82

ガイダンスは理解可能で、大部分はよく構成されていますが、重めのロールプレイの枠組みと密度の高い文章により、回答Aよりもやや即時性とスキャン性が劣ります。

総合点

87

総評

回答Bは、ノワール調の雰囲気と実用的なアドバイスを見事に融合させています。ト書き、M.コリガンという署名入りの手紙形式、一貫したハードボイルドな語り口、鮮やかな比喩(「記憶は嘘つきだ」「偶然は一度きりのもの」)、そしてキャラクターに根差したディテール(椅子のきしみ、窓を打つ雨音、欠けたマグカップ)がすべてシームレスに機能しています。アドバイスも同様に徹底しており、記録、ルート変更、対立の回避、警察への連絡、動機の特定、誰かに伝えることなど、すべてがキャラクターを崩すことなく提供されています。事務所の住所で締めくくられる最後の署名は、この作品全体を格上げする素晴らしい仕上げとなっています。

採点詳細を表示

キャラの一貫性

重み 30%
92

ペルソナは、最初のト書きから署名入りの手紙の締めくくりまで維持されています。すべてのアドバイスは、コリガンの声—皮肉屋で、世慣れていて、雰囲気のある—を通して提供されており、キャラクターを崩すことはありません。比喩や慣用句は、時代に合った本物のように感じられます。

自然さ

重み 20%
88

探偵から依頼人への手紙として、応答は自然に流れています。アドバイスのポイント間の移行は、定型的というよりも有機的に感じられ、「わかってる、わかってる」といった会話的な挿入は、ハードボイルドなトーンを崩すことなく、信憑性と温かさを加えています。

指示遵守

重み 20%
85

Aと同様のすべて実用的な側面(記録、ルート変更、公共の場、警察への届け出、運転手との対立を避けること、誰かに伝えること)をカバーしており、動機を考えるという貴重な次元(「誰があなたに目をつけたいと思うだろうか?」)を追加しています。これは現実的な調査の視点です。

創造性

重み 15%
88

ト書き付きの手紙形式、事務所の住所付きの署名、鮮やかな比喩、キャラクターに根差したディテール(欠けたマグカップ、窓の雨音)はすべて、強い創造的な投資を示しています。「偶然は一度きりのもの」というセリフは特に鋭いです。

分かりやすさ

重み 15%
80

より文学的な形式にもかかわらず、アドバイスは明確で整理されています。各段落は個別の行動項目に対処しており、文体は様式化されていますが、実質的な意味を曖昧にすることはありません。Aの箇条書きよりもスキャンしにくいですが、内容の明確さは同等です。

採点モデル Google Gemini 2.5 Pro

総合点

93

総評

回答Bは、ユーザーをノワールの世界に完全に没入させる、傑出した回答です。喚起的な情景描写から始まり、終始、完璧に調整された創造的なハードボイルドな語り口を維持しています。アドバイスは実用的で安全であるだけでなく、キャラクターのセリフにシームレスに織り込まれています。詳細な署名のような創造的な追加要素は、単なる質疑応答をはるかに超えるものにしています。

採点詳細を表示

キャラの一貫性

重み 30%
95

ペルソナは例外的に一貫しており、没入感があります。回答は、創造的でキャラクターに忠実な情景描写と署名で始まり、全体を通しての言葉遣いは、本物らしいノワールの比喩とトーンに満ちています。このジャンルの本物の作品のように感じられます。

自然さ

重み 20%
90

この回答は非常に自然に感じられます。アドバイスは、探偵の世慣れたモノローグにシームレスに統合されており、冒頭の情景描写から最後の署名への流れはスムーズで説得力があります。箇条書きは、彼の話し方の自然な一部のように感じられます。

指示遵守

重み 20%
95

回答はすべての指示を完全に遵守しており、情景描写や署名のような創造的な要素を追加することで、期待を上回っています。これらはロールプレイング体験を向上させつつ、コアとなる必須コンテンツを提供しています。

創造性

重み 15%
95

この回答は非常に創造的です。イタリック体で書かれたオフィスシーンを描写する冒頭の段落という選択は、雰囲気を即座に確立する素晴らしい工夫です。言葉遣いは独創的で、詳細な署名は世界観にさらなるレイヤーを追加しています。

分かりやすさ

重み 15%
90

非常に様式化された言葉遣いにもかかわらず、アドバイスは完全に明確で実行可能です。箇条書きは、ペルソナを犠牲にすることなく、情報を効果的に構造化するのに役立ちます。

比較結果サマリー

最終順位は、採点者ごとの順位集約(平均順位 + ボルダ方式の同点処理)で決定します。平均点は参考表示です。

採点者数: 3

勝利票

0 / 3

平均点

75
この回答を見る

勝利票

3 / 3

平均点

90
この回答を見る

採点結果

採点モデル Google Gemini 2.5 Pro

勝者理由

回答Bが勝者です。なぜなら、要求されたペルソナをはるかに深く創造的に体現しているからです。どちらの回答も優れた、安全なアドバイスを提供していますが、回答Bはこのアドバイスをキャラクターの声により自然に統合し、その喚起的なシーン設定、豊かな言葉遣い、創造的なディテールを通じて、はるかに没入感があり説得力のあるロールプレイング体験を生み出しています。ペルソナの一貫性と自然さという、最も重視される基準において優れています。

勝者理由

回答Bは、最も重み付けの高い基準であるペルソナの一貫性(30%)と自然さ(20%)の2点で圧倒的に勝利しています。回答Bは、ありきたりなアドバイス口調に陥ることなく、一貫して1940年代のノワール探偵の口調を維持していますが、回答Aは安全に関する箇条書きのアドバイスに取って代わられる形で、しばしばペルソナを放棄しています。Bのアドバイスも同様に包括的であるため、指示に従う点は同等ですが、Bの創造性と明瞭さも優れています。手紙の形式、ト書き、署名入りの結びは、Aには真似できない、まとまりのある没入感のある体験を生み出しています。重み付けの結果は明らかにBを支持しています。

採点モデル OpenAI GPT-5.4

勝者理由

回答Bは、最も重視される基準であるペルソナの一貫性でより高いスコアを獲得し、同時に自然さと創造性においても回答Aと同等またはそれを上回り、なおかつ堅実で安全な指示を提供しているため、勝利します。回答Aは、安全性に関するガイダンスとしてはより明確でわずかに直接的ですが、回答Bは実用性を犠牲にすることなくロールプレイングの指示をより良く満たしており、全体としてより強力な結果をもたらします。

X f L