ロールプレイ
ロールプレイジャンルにおけるAIモデルの比較結果を確認できます。評価基準、ランキング、最新のベンチマーク例をまとめています。
ジャンル概要
役になりきる一貫性や自然な会話力を比較します。
このジャンルでは、主に キャラの一貫性、自然さ、指示遵守 のような力を見ようとしています。
共感やカウンセリングよりも、役になりきれるか、自然な会話が続くかを強く見ているジャンルです。
ここで高得点でも、事実の正確さや安全な助言、分析タスクへの強さまで保証されるわけではありません。
このジャンルで強いAIが向いている用途
キャラクターチャット、シミュレーション、ロールベースの対話体験です。
このジャンルだけでは判断しきれないこと
調査、コーディング、慎重な支援会話の適性までは分かりません。
このジャンルに強いモデルランキング
このランキングは当ジャンルに限定したスコアの平均順です。
最終更新: 2026/03/21 10:18
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
| モデル |
|
|
詳細 | ||||
|---|---|---|---|---|---|---|---|
| 1位 | Claude Opus 4.6 | Anthropic |
100%
|
89
|
7 | 7 | Claude Opus 4.6 の評価・スコアを見る |
| 2位 | Claude Sonnet 4.6 | Anthropic |
100%
|
86
|
3 | 3 | Claude Sonnet 4.6 の評価・スコアを見る |
| 3位 | GPT-5 mini | OpenAI |
67%
|
78
|
2 | 3 | GPT-5 mini の評価・スコアを見る |
| 4位 | GPT-5.4 | OpenAI |
33%
|
84
|
1 | 3 | GPT-5.4 の評価・スコアを見る |
| 5位 | Gemini 2.5 Pro |
33%
|
84
|
1 | 3 | Gemini 2.5 Pro の評価・スコアを見る | |
| 6位 | Claude Haiku 4.5 | Anthropic |
33%
|
84
|
1 | 3 | Claude Haiku 4.5 の評価・スコアを見る |
| 7位 | GPT-5.2 | OpenAI |
0%
|
80
|
0 | 2 | GPT-5.2 の評価・スコアを見る |
| 8位 | Gemini 2.5 Flash |
0%
|
71
|
0 | 3 | Gemini 2.5 Flash の評価・スコアを見る | |
| 9位 | Gemini 2.5 Flash-Lite |
0%
|
69
|
0 | 3 | Gemini 2.5 Flash-Lite の評価・スコアを見る |
このジャンルで評価している項目
このジャンルで使っている採点基準と重みです。
キャラの一貫性
30.0%
この項目は、回答の キャラの一貫性 を確かめるために入れています。 比重が重いのは、この部分が弱いとジャンル全体の評価が崩れやすいからです。
自然さ
20.0%
この項目は、回答の 自然さ を確かめるために入れています。 比重がしっかりあるのは、全体の良し悪しに目に見えて効いてくる項目だからです。
指示遵守
20.0%
この項目は、回答の 指示遵守 を確かめるために入れています。 比重がしっかりあるのは、全体の良し悪しに目に見えて効いてくる項目だからです。
創造性
15.0%
この項目は、回答の 創造性 を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。
分かりやすさ
15.0%
この項目は、回答の 分かりやすさ を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。
最新のお題
ロールプレイ
電話で不安な犬の飼い主に助言する救急獣医
あなたは電話で不安な犬の飼い主と話している救急獣医です。落ち着いた実務的な獣医の役を保ってください。飼い主は次のように言います: "もしもし、すごく怖いです。うちの7歳のラブラドールが20分ほど前にガレージに入ってしまって、床に破れたシュガーフリーのガムの袋が落ちているのを見つけました。中に何個入っていたかはわかりません。今は普段通りに見えますが、少し落ち着きがないかもしれません。最寄りの救急診療所まで車で約35分です。どうしたらいいですか?" 獣医として応答してください。電話での実際の会話のように聞こえること、共感を示すこと、最も重要な追加質問をすること、パニックを招かないように即時のリスクを明確に説明すること、そして今後1時間の間に取るべき現実的な次の行動を示すこと。確実に診断できると主張しないこと。自分がAIであることに触れないこと。
ロールプレイ
ヴィクトリア朝の植物学者による室内植物の手入れの助言
あなたは、エレアノラ・ウィットフィールド教授、すなわちヴィクトリア朝時代(約1885年頃)に活躍した著名な植物学者であり、英国帝国全域の植物種を数十年にわたり目録化してきました。あなたは情熱的でやや風変わり、かつ教養あるヴィクトリア朝の人物に典型的な、格式ばっていながらも温かな話しぶりをします。あなたは野外遠征の話を引き合いに出し、あらゆる事柄を海外で出会った標本と比較する癖があります。 温室を訪れた来訪者があなたに次のように尋ねます: 「ウィットフィールド教授、私のシダは先端が茶色くなり、葉を落としてしまいます。毎日水をやり、居間の陽の当たる窓辺に置いています。私は何を間違えているのでしょうか?」 ウィットフィールド教授として完全に役になりきって答えてください。あなたの回答は次の点を満たすこと: 1. ヴィクトリア朝の人物像に一貫して忠実であること(語彙、調子、物腰) 2. 少なくとも一つの逸話または架空の遠征の言及を含むこと 3. シダの世話について実際に正確で有用な助言を提供すること 4. 来訪者に対して温かく励ます態度であること 5. およそ200〜350語の長さであること
ロールプレイ
熟練したビデオゲームサポート担当者としてロールプレイする
あなたは、絶大な人気を誇るオンラインRPG『Aethelgard's Echo』の、経験豊富で辛抱強いカスタマーサポート担当者、Alexです。ドラゴン絡みの不具合からサーバー障害まで、あらゆる事態を見てきました。口調は落ち着いていて、知識が豊富で、共感的ですが、無数の冒険者たちの悩みに対処してきたことによる、わずかな疲れもにじませています。 プレイヤー『GimliTheGreat』が、次のサポートチケットを送信してきました。Alexとしてロールプレイしながら、役に立つ実行可能な手順を示して返信してください。 **プレイヤーチケット:** 件名:私のキャラクターが永遠に落ち続けてる!!! 本文: ふざけるな! 『Whispering Peaks』アップデート以降、メインキャラクターの『Stonehand』がAeridorの空中神殿でずっと落下アニメーションのループにハマったままなんだ。動けないし、アイテムも使えないし、何もできない。もう20回くらい再ログインも試した。こんなバグのせいで『Solstice Dragon's Hoard』イベントに参加できなくなるだろ! 今すぐ直せ!
ロールプレイ
1940年代の私立探偵が現代の謎に挑む
見込み客があなたのオフィスに入ってくる。相手は神経質そうに見え、打ち込んだメッセージが書かれた紙切れをあなたに手渡す。あなたの任務は、そのメッセージに対して、ジャック『ブラックジャック』フラナガンになりきって返答することだ。1940年代の人格、口調、語彙を保ちながら、相手のきわめて現代的な問題に対して、実際的で筋の通った返答をしなさい。以下がそのメッセージである。『フラナガンさん、力を貸してください。私は“ConnectSphere”というアプリで、何か月ものあいだ、ある人とオンラインで話してきました。自分では恋をしているのだと思いますが、私たちは一度も会ったことがありません。相手はいつも言い訳をして会おうとしません。家族の緊急事態だと言われて、その人にいくらかお金を送りましたが、今では友人たちに、私は“catfished”されているのかもしれないと言われています。それがどういう意味なのかもわかりませんが、怖いんです。この人物が本当は何者なのか、突き止めてもらえますか?』
ロールプレイ
落ち着いた旅行代理店員としてのカスタマーサポート返信
あなたは、落ち着いていて、実務的で、共感力があることで知られる経験豊富な旅行代理店担当者、Mayaとしてロールプレイしています。以下の顧客メッセージに、キャラクターになりきって返信してください。 顧客メッセージ: "こんにちは。とてもいら立っています。バルセロナ行きのフライトが明日の朝なのに、航空会社から6時間遅い便に変更されたというメールが今届きました。ということは、私が登壇する予定のカンファレンス初日を逃してしまいます。こういうことを円滑に対応してほしかったから、すべて御社の代理店を通じて予約したのです。ありきたりな謝罪は要りません。今すぐ自分にどんな選択肢があるのか、別の便に変更できるのか、そしてすでに前払いしたホテル送迎がどうなるのかを知る必要があります。明確な回答を早くください。" Mayaらしく聞こえる単一の返信を書いてください。顧客のいら立ちに言及し、現実的な次の対応を説明し、確認できない約束は避け、本当に役に立つ内容にしてください。AIであることに言及したり、航空会社のライブシステムにアクセスできるかのようにでっち上げたりしてはいけません。返信は、今まさに送られる本物のカスタマーサポートメッセージのように読める必要があります。
ロールプレイ
テクニカルサポートのロールプレイ:圧倒された祖父母
もしもし? こちらはヘルプラインですか? 孫が私の誕生日にこの新しい「タブレット」っていうものを用意してくれて、「ビデオチャット」ができるようにしてくれたんですけど、うまく動かせません。孫は小さなカメラのある緑のアイコンをタップするだけと言ったのですが、それをタップすると音は鳴るものの何も起きません。自分の顔は見えるんですが、孫の姿が見えません。テレビ番組でやっているみたいに電源を切って入れ直してみたんですが、それでも動きません。自分がとてもおかしく思えて、ただ孫たちに会いたいだけなんです。簡単な言葉で助けていただけますか? こういう専門用語はよくわからないんです。