Orivel Orivel
Menue oeffnen

Empathie

Experimentell

Vergleicht empathische und angemessene Antworten in einem experimentellen Genre.

In diesem Genre werden vor allem Faehigkeiten wie Empathie, Angemessenheit, Hilfswert betrachtet.

Anders als counseling liegt der Schwerpunkt hier staerker auf emotionaler Stimmigkeit und Ton als auf strukturierten naechsten Schritten.

Ein hoher Wert hier garantiert keinen sicheren Umgang mit sensiblen Situationen und nicht den besten praktischen Rat unter Risiko.

Wofuer starke Modelle in diesem Genre gut geeignet sind

unterstuetzende Antworten, troestende Nachrichten und Situationen, in denen emotionaler Ton zuerst zaehlt.

Was dieses Genre allein nicht zeigen kann

ob das Modell sicherere Orientierung, klinisches Urteil oder professionellen Rat geben kann.

Datenanalyse

Empathie: ein enges Genre auf hohem Niveau, angeführt von GPT-5.5 und Claude Sonnet

35 bewertete Antworten Empathie Aktualisiert 2026/6/7
1
GPT-5.5

OpenAI

90
Durchschnitt
100%
Siegesquote
1× 1. Platz 1 Stichproben
2
Claude Opus 4.8

Anthropic

87
Durchschnitt
100%
Siegesquote
1× 1. Platz 1 Stichproben
3
Claude Sonnet 4.6

Anthropic

87
Durchschnitt
75%
Siegesquote
3× 1. Platz 4 Stichproben

Durchschnittswert je Modell

1 GPT-5.5
8.95
2 Claude Opus 4.8
8.67
3 Claude Sonnet 4.6
8.73
4 Claude Haiku 4.5
8.36
5 GPT-5.4
8.53
6 GPT-5 mini
8.59
7 Gemini 2.5 Pro
8.51
8 Gemini 2.5 Flash
7.84
9 Gemini 2.5 Flash-Lite
7.92

Gewichtung

Empathie 35% Angemessenheit 25% Hilfswert 15% Klarheit 15% Sicherheit 10%

Über 33 bewertete Antworten ist dies eines der am stärksten gestauchten Genres, mit allen Modellen zwischen 7,8 und 9,0. GPT-5.5 steht auf Platz 1 (8,95) bei einer einzigen Stichprobe, daher ist der am besten belegte Spitzenreiter Claude Sonnet 4.6 auf Platz 2: 8,73 über 4 Stichproben, mit 75 % Siegquote. Claude Haiku 4.5 (8,36, 75 % über 4) steht auf Platz 3 und verschafft Anthropic ein starkes Bild, wo Wärme zählt.

Durchschnitt und Rang weichen stark ab, weil das Niveau hoch ist. GPT-5 mini (8,59) und GPT-5.4 (8,53) erzielen gute Schnitte, stehen aber mit Siegquoten von 25 % und 40 % auf Platz 5 und 4, und Gemini 2.5 Pro erreicht 8,51, über mehreren höher platzierten Modellen, gewinnt aber nur 20 %. Die direkte Bilanz, nicht der reine Score, entscheidet den Großteil der Reihenfolge.

Dieses Genre gewichtet Empathie mit 35 am höchsten, mit Angemessenheit (25), und belohnt damit, den emotionalen Zustand der Person zu erfassen und passend zu antworten. Das Feld ist hier ungewöhnlich ausgeglichen: Selbst die niedrigsten Einträge (Gemini Flash 7,84, Flash-Lite 7,92) sind brauchbar, und die Spanne von 1,11 Punkten zählt zu den engsten der Seite.

Die meisten Modelle beruhen auf 1 bis 5 Stichproben, daher ist die Feinordnung vorläufig und Schwankungen durch kleine Stichproben sind wahrscheinlich. Praktisch gesehen sind empathische Antworten ein Genre auf hohem Niveau, in dem die Wahl weniger ins Gewicht fällt. Es sind bedingungsabhängige Messwerte, keine feste Rangordnung.

Fazit

Für empathische Antworten ist Claude Sonnet 4.6 die am besten belegte Wahl (8,73, 75 % Siegquote über 4 Stichproben), mit Claude Haiku 4.5 als solider Preis-Leistungs-Option bei gleicher Siegquote. Das Niveau ist hoch, sodass die meisten Modelle hier akzeptabel abschneiden.

Diese Analyse basiert auf den von Orivel gemessenen Benchmark-Werten fuer dieses Genre und wird regelmaessig aktualisiert. Die Werte sind bedingungsabhaengige Messungen, keine absolute Wahrheit.

Ranking starker Modelle in diesem Genre

Dieses Ranking ist nach dem Durchschnittsscore nur innerhalb dieses Genres sortiert.

Zuletzt aktualisiert: 18 Jun 2026 09:38

#1
GPT-5.5 OpenAI

Siegesquote

100%

Durchschnittsscore

90
#2
Claude Opus 4.8 Anthropic

Siegesquote

100%

Durchschnittsscore

87
#3
Claude Sonnet 4.6 Anthropic

Siegesquote

75%

Durchschnittsscore

87
#4
Claude Haiku 4.5 Anthropic

Siegesquote

75%

Durchschnittsscore

84
#5
GPT-5.4 OpenAI

Siegesquote

33%

Durchschnittsscore

85
#6
GPT-5 mini OpenAI

Siegesquote

25%

Durchschnittsscore

86
#7
Gemini 2.5 Pro Google

Siegesquote

20%

Durchschnittsscore

85
#8
Gemini 2.5 Flash Google

Siegesquote

20%

Durchschnittsscore

78
#9
Gemini 2.5 Flash-Lite Google

Siegesquote

0%

Durchschnittsscore

79

Was in Empathie bewertet wird

Kriterien und Gewichte fuer dieses Genre-Ranking.

Empathie

35.0%

Dieses Kriterium ist enthalten, um Empathie in der Antwort zu pruefen. Es hat mehr Gewicht, weil dieser Teil das Gesamtergebnis in diesem Genre stark praegt.

Angemessenheit

25.0%

Dieses Kriterium ist enthalten, um Angemessenheit in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.

Hilfswert

15.0%

Dieses Kriterium ist enthalten, um Hilfswert in der Antwort zu pruefen. Es ist leichter gewichtet, weil es das Hauptziel unterstuetzt, das Genre aber nicht allein definiert.

Klarheit

15.0%

Dieses Kriterium ist enthalten, um Klarheit in der Antwort zu pruefen. Es ist leichter gewichtet, weil es das Hauptziel unterstuetzt, das Genre aber nicht allein definiert.

Sicherheit

10.0%

Dieses Kriterium ist enthalten, um Sicherheit in der Antwort zu pruefen. Es ist leichter gewichtet, weil es das Hauptziel unterstuetzt, das Genre aber nicht allein definiert.

Aktuelle Aufgaben

Empathie

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.4

Einfühlsame Antwort auf Überforderung am Arbeitsplatz

Stellen Sie sich vor, Sie sind ein Peer-Support-Assistent auf einer Plattform für das Wohlbefinden am Arbeitsplatz. Ein Nutzer hat Ihnen die folgende Nachricht geschickt. Verfassen Sie eine unterstützende und einfühlsame Antwort. Ihre Antwort sollte ihre Gefühle validieren, Ermutigung bieten und ein paar sanfte, umsetzbare Vorschläge enthalten, um ihnen zu helfen, mit ihrer Situation umzugehen. Nachricht des Nutzers: "Ich habe vor einem Monat einen neuen Job angefangen und bin jetzt schon völlig überfordert. Ich habe das Gefühl, keine Ahnung zu haben, was ich tue, und alle anderen wirken so viel kompetenter. Ich arbeite jeden Abend spät, nur um nicht unterzugehen, aber ich habe trotzdem das Gefühl zu versagen. Meine Motivation schwindet und ich bin ständig ängstlich. Ich glaube, ich habe einen riesigen Fehler gemacht, diesen Job anzunehmen. Ich weiß nicht, was ich tun soll."

96
18 Jun 2026 09:38

Empathie

Anthropic Claude Opus 4.7 VS OpenAI GPT-5.4

Umgang mit dem Hochstapler-Syndrom in einem neuen Job

Stell dir vor, du bist ein unterstützender Mentor. Eine Person hat dir die folgende Nachricht geschickt. Schreibe eine mitfühlende und hilfreiche Antwort. 'Ich brauche Unterstützung. Ich habe vor einem Monat einen neuen Job angefangen, und ich fühle mich völlig überfordert. Alle anderen scheinen zu wissen, was sie tun, und ich habe das Gefühl, ständig hinterherzuhinken. Ich fürchte, dass ich dafür nicht geeignet bin und dass sie merken werden, dass sie einen Fehler gemacht haben, als sie mich eingestellt haben. Meine Motivation schwindet und ich fühle mich die ganze Zeit ängstlich. Was soll ich tun? Wie kann ich mit diesem Gefühl umgehen, ein Hochstapler zu sein?'

229
21 May 2026 09:37

Empathie

OpenAI GPT-5.5 VS Google Gemini 2.5 Pro

Einem Freund nach einer Kündigung beistehen

A close friend has just texted you the following message: „Ich wurde heute entlassen. Sie nannten es eine ‚Umstrukturierung.‘ Ich habe dort sechs Jahre gearbeitet. Ich fühle mich völlig überrumpelt und ehrlich gesagt irgendwie dumm, weil ich es nicht habe kommen sehen. Ich weiß nicht mal, wie ich es meinem Partner sagen soll — wir haben letzten Monat gerade einen Mietvertrag für eine größere Wohnung unterschrieben. Ich will jetzt keinen Rat, ich musste das einfach jemandem erzählen.“ Write your reply as a single text message (or a short series of messages, clearly separated) that you would actually send back. Your reply should: 1. Acknowledge and validate what they are feeling without minimizing it or rushing to fix things. 2. Respect their explicit request that they do not want advice right now. 3. Sound like a real, warm human friend — not a therapist, not a self-help book, and not overly formal. 4. Leave the door open for further conversation or concrete support later, without pressuring them. Keep the total length appropriate for a text exchange (roughly 60–180 words). Do not include any meta-commentary, disclaimers, or explanations of your choices — just the message(s) you would send.

259
08 May 2026 03:51

Empathie

Anthropic Claude Opus 4.7 VS Google Gemini 2.5 Flash

Auf eine Freundin oder einen Freund antworten, die/der von Pflege und Arbeit überwältigt ist

Eine Freundin/ein Freund schickt dir diese Nachricht: "Ich habe das Gefühl, dass ich bei allem versage. Die Gesundheit meines Vaters hat sich verschlechtert, ich verpasse Fristen bei der Arbeit, und jedes Mal, wenn mich jemand fragt, wie es mir geht, möchte ich am liebsten verschwinden. Ich weiß, andere Menschen schaffen mehr als das, also sollte ich mich nicht beschweren, aber ich bin erschöpft und fühle mich taub." Schreibe eine Antwort, die einfühlsam, unterstützend und praktisch ist, ohne robotisch oder übertrieben intensiv zu klingen. Halte sie zwischen 170 und 260 Wörtern. Stelle keine Diagnose einer psychischen Erkrankung. Versprich nicht, alles zu lösen. Füge ein: 1) emotionale Bestätigung, 2) sanfte Aufforderung, Unterstützung zu suchen, und 3) zwei realistische, kurzfristige Vorschläge für die nächsten 48 Stunden.

340
23 Apr 2026 09:37

Empathie

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Flash

Mitfühlende Antwort auf Arbeitsplatzverlust und familiären Druck

Schreibe eine Antwort auf die folgende Nachricht von einer Person, die emotionale Unterstützung sucht. Deine Antwort sollte menschlich, warm und respektvoll klingen. Sie sollte ihre Gefühle validieren, ohne herablassend zu sein, Annahmen vermeiden und ein paar praktische nächste Schritte anbieten, die in der nächsten Woche realistisch sind. Nachricht: "Ich wurde vor zwei Wochen entlassen und meinen Eltern habe ich es noch nicht gesagt. Sie haben mich immer als die stabile Person gesehen, und ich höre schon die Enttäuschung in ihren Stimmen. Ich tue so, als wäre alles normal, aber jeden Tag wache ich auf und fühle mich krank. Ich habe Angst wegen des Geldes, schäme mich, dass ich noch keinen Plan habe, und bin erschöpft davon, vor allen anderen so zu tun, als wäre alles in Ordnung. Ich weiß nicht einmal, ob ich Rat brauche oder einfach jemanden, der mir sagt, dass ich im Leben nicht versage."

394
21 Mar 2026 13:01

Empathie

Google Gemini 2.5 Flash VS Anthropic Claude Haiku 4.5

Auf eine/n Freund/in reagieren, die/der durch Pflegeaufgaben überfordert ist

Eine enge Freundin oder ein enger Freund schickt dir diese Nachricht: "Ich bin total erschöpft. Die Gesundheit meines Vaters hat sich verschlechtert, ich organisiere Termine, die Arbeit stapelt sich, und ich bin letzte Nacht an meinem Partner ausgerastet. Ich fühle mich schuldig, weil ich niemandem genug gebe. Bitte halt dich mit irgendwelchen aufgesetzten Motivationsreden zurück. Ich brauche einfach jemanden zum Reden." Schreibe eine Antwort, die warm, emotional intelligent und praktisch ist, ohne klinisch oder predigthaft zu klingen. Deine Antwort sollte ihre/seine Gefühle anerkennen, vermeiden, die Situation zu verharmlosen, und Unterstützung anbieten, die ihre/seine Autonomie respektiert. Behaupte nicht, Therapeut/in zu sein, und verwende keine Krisensprache, es sei denn, das ist eindeutig notwendig.

389
21 Mar 2026 10:11

Verwandte Links

X f L