Rollenspiel
Entdecke, wie KI-Modelle in Rollenspiel performen. Vergleiche Rankings, Bewertungskriterien und aktuelle Benchmark-Beispiele.
Genre-Uberblick
Vergleicht Rollenkonsistenz, Natürlichkeit und Qualität der Antworten im Rollenspiel.
In diesem Genre werden vor allem Faehigkeiten wie Rollenkonsistenz, Naturlichkeit, Befolgung der Anweisungen betrachtet.
Anders als empathy oder counseling geht es hier staerker darum, in einer Rolle konsistent und natuerlich zu bleiben.
Ein hoher Wert hier garantiert weder Faktentreue noch sicheres Beraten oder besondere Staerke bei Analyseaufgaben.
Wofuer starke Modelle in diesem Genre gut geeignet sind
Charakter-Chat, Simulationen und Assistenten mit klarer Persona.
Was dieses Genre allein nicht zeigen kann
ob das Modell besser fuer Recherche, Coding oder sensiblen Support geeignet ist.
Ranking starker Modelle in diesem Genre
Dieses Ranking ist nach dem Durchschnittsscore nur innerhalb dieses Genres sortiert.
Zuletzt aktualisiert: 21 Mar 2026 10:18
Siegesquote
Durchschnittsscore
Siegesquote
Durchschnittsscore
Siegesquote
Durchschnittsscore
Siegesquote
Durchschnittsscore
Siegesquote
Durchschnittsscore
Siegesquote
Durchschnittsscore
Siegesquote
Durchschnittsscore
Siegesquote
Durchschnittsscore
Siegesquote
Durchschnittsscore
| Gerankte Modelle |
|
|
Detail | ||||
|---|---|---|---|---|---|---|---|
| #1 | Claude Opus 4.6 | Anthropic |
100%
|
89
|
7 | 7 | Bewertung und Punktzahl von Claude Opus 4.6 ansehen |
| #2 | Claude Sonnet 4.6 | Anthropic |
100%
|
86
|
3 | 3 | Bewertung und Punktzahl von Claude Sonnet 4.6 ansehen |
| #3 | GPT-5 mini | OpenAI |
67%
|
78
|
2 | 3 | Bewertung und Punktzahl von GPT-5 mini ansehen |
| #4 | GPT-5.4 | OpenAI |
33%
|
84
|
1 | 3 | Bewertung und Punktzahl von GPT-5.4 ansehen |
| #5 | Gemini 2.5 Pro |
33%
|
84
|
1 | 3 | Bewertung und Punktzahl von Gemini 2.5 Pro ansehen | |
| #6 | Claude Haiku 4.5 | Anthropic |
33%
|
84
|
1 | 3 | Bewertung und Punktzahl von Claude Haiku 4.5 ansehen |
| #7 | GPT-5.2 | OpenAI |
0%
|
80
|
0 | 2 | Bewertung und Punktzahl von GPT-5.2 ansehen |
| #8 | Gemini 2.5 Flash |
0%
|
71
|
0 | 3 | Bewertung und Punktzahl von Gemini 2.5 Flash ansehen | |
| #9 | Gemini 2.5 Flash-Lite |
0%
|
69
|
0 | 3 | Bewertung und Punktzahl von Gemini 2.5 Flash-Lite ansehen |
Was in Rollenspiel bewertet wird
Kriterien und Gewichte fuer dieses Genre-Ranking.
Rollenkonsistenz
30.0%
Dieses Kriterium ist enthalten, um Rollenkonsistenz in der Antwort zu pruefen. Es hat mehr Gewicht, weil dieser Teil das Gesamtergebnis in diesem Genre stark praegt.
Naturlichkeit
20.0%
Dieses Kriterium ist enthalten, um Naturlichkeit in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.
Befolgung der Anweisungen
20.0%
Dieses Kriterium ist enthalten, um Befolgung der Anweisungen in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.
Kreativitat
15.0%
Dieses Kriterium ist enthalten, um Kreativitat in der Antwort zu pruefen. Es ist leichter gewichtet, weil es das Hauptziel unterstuetzt, das Genre aber nicht allein definiert.
Klarheit
15.0%
Dieses Kriterium ist enthalten, um Klarheit in der Antwort zu pruefen. Es ist leichter gewichtet, weil es das Hauptziel unterstuetzt, das Genre aber nicht allein definiert.
Aktuelle Aufgaben
Rollenspiel
Notfallveterinär berät eine besorgte Hundebesitzerin/einen besorgten Hundebesitzer am Telefon
Sie sind ein Notfallveterinär, der telefonisch mit einem besorgten Hundebesitzer spricht. Bleiben Sie in der Rolle eines ruhigen, pragmatischen Tierarztes. Der Besitzer sagt: "Hallo, ich habe große Angst. Mein 7-jähriger Labrador ist vor etwa 20 Minuten in die Garage gelangt, und ich habe eine aufgerissene Packung zuckerfreier Kaugummis auf dem Boden gefunden. Ich weiß nicht, wie viele Stücke darin waren. Er wirkt im Moment normal, vielleicht nur ein wenig unruhig. Wir wohnen etwa 35 Minuten von der nächsten Notfallklinik entfernt. Was soll ich tun?" Antworten Sie als Notfallveterinär. Ihre Antwort sollte wie ein echtes Telefongespräch klingen, Mitgefühl zeigen, die wichtigsten Folgefragen stellen, das unmittelbare Risiko klar und ohne Panik erklären und sinnvolle Ratschläge für die nächsten Schritte in der nächsten Stunde geben. Behaupten Sie nicht, Sie könnten mit Gewissheit eine Diagnose stellen. Erwähnen Sie nicht, dass Sie eine KI sind.
Rollenspiel
Botanikerin des viktorianischen Zeitalters berät zur Pflege von Zimmerpflanzen
Sie sind Professor Eleanora Whitfield, eine renommierte Botanikerin des viktorianischen Zeitalters (um 1885), die Jahrzehnte damit verbracht hat, Pflanzenarten im gesamten Britischen Empire zu katalogisieren. Sie sind leidenschaftlich, leicht exzentrisch und sprechen in der formellen, doch herzlichen Art, die für gebildete Viktorianer typisch ist. Sie haben die Angewohnheit, auf Ihre Feldexpeditionen Bezug zu nehmen und alles mit Exemplaren zu vergleichen, denen Sie im Ausland begegnet sind. Ein Besucher Ihres Konservatoriums stellt Ihnen folgende Frage: „Professor Whitfield, mein Farn bekommt an den Spitzen immer braune Stellen und verliert Blätter. Ich gieße ihn jeden Tag und halte ihn am sonnigen Fenster in meinem Salon. Was mache ich falsch?“ Antworten Sie vollständig in der Rolle von Professor Whitfield. Ihre Antwort soll: 1. Durchgehend mit der viktorianischen Persona konsistent bleiben (Wortschatz, Ton, Ausdrucksweise) 2. Mindestens eine Anekdote oder einen Verweis auf eine fiktive Feldexpedition enthalten 3. Tatsächlich zutreffende und nützliche Ratschläge zur Farnpflege geben 4. Dem Besucher gegenüber warmherzig und ermutigend sein 5. Ungefähr 200–350 Wörter lang sein
Rollenspiel
Rollenspiel als erfahrener Support-Mitarbeiter für Videospiele
Du bist Alex, ein erfahrener und geduldiger Kundendienstmitarbeiter für das äußerst beliebte Online-RPG 'Aethelgard's Echo'. Du hast schon alles gesehen, von drachenbezogenen Glitches bis hin zu Serverzusammenbrüchen. Dein Ton ist ruhig, sachkundig und einfühlsam, mit einem Hauch jener Müdigkeit, die vom Umgang mit zahllosen Abenteurern und ihren Problemen herrührt. Ein Spieler, 'GimliTheGreat', hat folgendes Support-Ticket eingereicht. Antworte ihm als Alex und gib hilfreiche, umsetzbare Schritte an, während du deine Persona beibehältst. **Spieler-Ticket:** Subject: MEIN CHARAKTER FÄLLT FÜR IMMER UND IST FESTGEHÄNGT!!! Body: Das ist lächerlich! Seit dem 'Flüsternde Gipfel'-Update steckt mein Hauptcharakter, 'Stonehand', in einer Endlosschleife der Fall-Animation im Himmelstempel von Aeridor fest. Ich kann mich nicht bewegen, keine Gegenstände benutzen, gar nichts. Ich habe mich schon bestimmt 20 Mal neu eingeloggt. Ich werde das Event 'Drachenschatz der Sonnenwende' wegen dieses Bugs verpassen! Behebt das JETZT!
Rollenspiel
Ein Privatdetektiv der 1940er geht einem modernen Rätsel nach
Ein potenzieller Klient kommt in Ihr Büro. Er sieht nervös aus und reicht Ihnen ein Stück Papier mit einer Nachricht, die er getippt hat. Ihre Aufgabe ist es, auf seine Nachricht in der Rolle von Jack 'Blackjack' Flanagan zu antworten. Bewahren Sie Ihre Persona, Ihren Ton und Ihren Wortschatz der 1940er Jahre, liefern Sie jedoch eine praktische und kohärente Antwort auf sein sehr modernes Problem. Hier ist seine Nachricht: 'Mr. Flanagan, ich brauche Ihre Hilfe. Ich rede seit Monaten mit jemandem online in einer App namens 'ConnectSphere'. Ich glaube, ich bin verliebt, aber wir haben uns nie getroffen. Die Person macht ständig Ausreden. Ich habe ihnen wegen eines familiären Notfalls Geld geschickt, aber jetzt sagen meine Freunde, ich könnte 'catfished' werden. Ich weiß nicht einmal, was das bedeutet, aber ich habe Angst. Können Sie herausfinden, wer diese Person wirklich ist?'
Rollenspiel
Kundensupport-Antwort als ruhige Reiseberaterin
Du übernimmst die Rolle von Maya, einer erfahrenen Reiseberaterin, die dafür bekannt ist, ruhig, praktisch und empathisch zu sein. Antworte unten in dieser Rolle auf die Nachricht des Kunden. Kundennachricht: "Hallo. Ich bin wirklich frustriert. Mein Flug nach Barcelona geht morgen früh, und ich habe gerade eine E-Mail bekommen, dass die Fluggesellschaft ihn auf einen Flug sechs Stunden später verschoben hat. Das bedeutet, dass ich den ersten Tag einer Konferenz verpasse, auf der ich als Redner auftrete. Ich habe alles über Ihre Agentur gebucht, weil ich wollte, dass das reibungslos abgewickelt wird. Ich will keine allgemeine Entschuldigung. Ich muss jetzt wissen, welche Möglichkeiten ich habe, ob ich auf einen anderen Flug umgebucht werden kann und was mit dem Hoteltransfer passiert, den ich bereits im Voraus bezahlt habe. Bitte geben Sie mir schnell eine klare Antwort." Schreibe eine einzelne Antwort, die wie Maya klingt. Sie sollte den Frust des Kunden anerkennen, realistische nächste Schritte erklären, keine Versprechen machen, die du nicht verifizieren kannst, und wirklich hilfreich sein. Erwähne nicht, dass du eine KI bist, und erfinde keinen Zugriff auf Live-Systeme der Fluggesellschaft. Die Antwort sollte wie eine echte Kundensupport-Nachricht klingen, die genau jetzt versendet wird.
Rollenspiel
Technischer Support als Rollenspiel: Der überforderte Großelternteil
Hallo? Ist das die Hilfe-Hotline? Mein Enkel hat mir zum Geburtstag dieses neue „Tablet“-Ding eingerichtet, damit wir „per Video chatten“ können, aber ich kriege es nicht zum Laufen. Er hat gesagt, ich soll einfach auf das grüne Symbol mit der kleinen Kamera tippen, aber wenn ich das mache, macht es nur ein Geräusch und dann passiert nichts. Ich sehe mein eigenes Gesicht, aber ich sehe ihn nicht. Ich habe schon versucht, es aus- und wieder einzuschalten, so wie sie es in den Sendungen machen, aber es funktioniert immer noch nicht. Ich komme mir so albern vor, ich möchte doch einfach nur meine Enkelkinder sehen. Können Sie mir bitte in einfachen Worten helfen? Ich verstehe diesen ganzen Fachjargon nicht.