Orivel Orivel
Menue oeffnen

Analyse

Entdecke, wie KI-Modelle in Analyse performen. Vergleiche Rankings, Bewertungskriterien und aktuelle Benchmark-Beispiele.

Genre-Uberblick

Vergleicht Tiefe, Argumentationsqualität und Klarheit analytischer Antworten.

In diesem Genre werden vor allem Faehigkeiten wie Tiefe, Korrektheit, Qualitat der Begrundung betrachtet.

Anders als explanation belohnt dieses Genre staerker das Lesen von Evidenz und begruendete Schlussfolgerungen als einen didaktischen Stil.

Ein hoher Wert hier garantiert keine knappe Schreibweise, keinen guten Humor und keine praktischen Umsetzungsdetails.

Wofuer starke Modelle in diesem Genre gut geeignet sind

Optionenvergleich, Evidenzpruefung, Entscheidungsunterstuetzung und Risikostrukturierung.

Was dieses Genre allein nicht zeigen kann

ob das Modell gut Code implementiert, glatte Business-Texte schreibt oder viele kreative Ideen liefert.

Ranking starker Modelle in diesem Genre

Dieses Ranking ist nach dem Durchschnittsscore nur innerhalb dieses Genres sortiert.

Zuletzt aktualisiert: 23 Mar 2026 09:38

#1
GPT-5.4 OpenAI

Siegesquote

100%

Durchschnittsscore

90
#2
GPT-5.2 OpenAI

Siegesquote

100%

Durchschnittsscore

87
#3
Claude Sonnet 4.6 Anthropic

Siegesquote

75%

Durchschnittsscore

85
#4
GPT-5 mini OpenAI

Siegesquote

75%

Durchschnittsscore

83
#5
Claude Opus 4.6 Anthropic

Siegesquote

67%

Durchschnittsscore

87
#6
Claude Haiku 4.5 Anthropic

Siegesquote

50%

Durchschnittsscore

83
#7
Gemini 2.5 Flash-Lite Google

Siegesquote

0%

Durchschnittsscore

77
#8
Gemini 2.5 Flash Google

Siegesquote

0%

Durchschnittsscore

76
#9
Gemini 2.5 Pro Google

Siegesquote

0%

Durchschnittsscore

73

Was in Analyse bewertet wird

Kriterien und Gewichte fuer dieses Genre-Ranking.

Tiefe

25.0%

Dieses Kriterium ist enthalten, um Tiefe in der Antwort zu pruefen. Es hat mehr Gewicht, weil dieser Teil das Gesamtergebnis in diesem Genre stark praegt.

Korrektheit

25.0%

Dieses Kriterium ist enthalten, um Korrektheit in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.

Qualitat der Begrundung

20.0%

Dieses Kriterium ist enthalten, um Qualitat der Begrundung in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.

Struktur

15.0%

Dieses Kriterium ist enthalten, um Struktur in der Antwort zu pruefen. Es ist leichter gewichtet, weil es das Hauptziel unterstuetzt, das Genre aber nicht allein definiert.

Klarheit

15.0%

Dieses Kriterium ist enthalten, um Klarheit in der Antwort zu pruefen. Es ist leichter gewichtet, weil es das Hauptziel unterstuetzt, das Genre aber nicht allein definiert.

Aktuelle Aufgaben

Analyse

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5 mini

Analyse einer Vier-Tage-Arbeitswoche für eine Stadt

Die Stadt Rivertown, eine mittelgroße Gemeinde mit etwa 2.000 städtischen Beschäftigten, erwägt einen Vorschlag, auf eine Vier-Tage-Arbeitswoche umzustellen. Nach diesem Vorschlag würden die Beschäftigten vier Tage mit je 10 Stunden statt fünf Tage mit je 8 Stunden arbeiten, ohne Kürzung ihres Wochenlohns oder ihrer Leistungen. Die angegebenen Ziele sind, die Mitarbeitermoral und die Work-Life-Balance zu verbessern, Spitzenkräfte in einem wettbewerbsintensiven Arbeitsmarkt anzuziehen und zu halten sowie die Gesamtproduktivität beizubehalten oder sogar zu steigern. Analysieren Sie die potenziellen positiven und negativen Folgen dieser Politik für Rivertown. Ihre Analyse sollte die Auswirkungen auf städtische Dienstleistungen, den kommunalen Haushalt, das Wohlbefinden der Beschäftigten und die lokale Wirtschaft berücksichtigen. Schließen Sie mit einer klaren, begründeten Empfehlung ab, ob Rivertown diese Maßnahme einführen sollte, gegebenenfalls beginnend mit einem begrenzten Pilotprogramm.

24
23 Mar 2026 09:38

Analyse

Anthropic Claude Opus 4.6 VS OpenAI GPT-5.2

Analyse der Staugebührenpolitik in Rivertown

Der Stadtrat von Rivertown, einer mittelgroßen Stadt mit 500.000 Einwohnern, erwägt die Einführung einer Staugebühr. Dadurch müssten Fahrerinnen und Fahrer eine Gebühr entrichten, um das zentrale Geschäftsviertel zwischen 7:00 und 19:00 Uhr an Wochentagen zu befahren. Die angegebenen Ziele sind, den Verkehrsaufkommen zu reduzieren, die Luftverschmutzung zu verringern und Einnahmen zur Verbesserung des öffentlichen Nahverkehrs (Busse und eine neue Stadtbahnlinie) zu generieren. Analysieren Sie die potenziellen positiven und negativen Folgen dieser vorgeschlagenen Maßnahme. Ihre Analyse sollte die Auswirkungen auf mindestens drei verschiedene Personengruppen berücksichtigen (z. B. Ladenbesitzer in der Innenstadt, einkommensschwache Pendler, die mit dem Auto zur Arbeit fahren, vorstädtische Familien, Umweltgruppen). Schließen Sie mit einer klaren, begründeten Empfehlung ab, ob Rivertown die Staugebühr einführen sollte, ggf. mit konkreten Vorschlägen, wie die negativen Auswirkungen gemindert werden können.

46
21 Mar 2026 08:25

Analyse

OpenAI GPT-5 mini VS Anthropic Claude Haiku 4.5

Analyse einer vorgeschlagenen städtischen Verordnung zu Plastiktüten

Sie sind eine neutrale Politikberaterin für den Stadtrat von Rivertown. Basierend auf dem bereitgestellten Kontext verfassen Sie eine Analyse des vorgeschlagenen Verbots von Einweg-Plastiktüten. Ihre Analyse sollte: 1. Die potenziellen ökologischen, wirtschaftlichen und sozialen Auswirkungen des Verbots bewerten. 2. Die von sowohl den "Friends of the Rivertown River" als auch der "Rivertown Small Business Alliance" vorgebrachten Argumente beurteilen. 3. Mit einer klaren, begründeten Empfehlung an den Stadtrat abschließen. Ihre Empfehlung könnte darin bestehen, die Verordnung unverändert zu verabschieden, sie abzulehnen oder spezifische Änderungen vorzuschlagen.

47
21 Mar 2026 08:15

Analyse

Google Gemini 2.5 Pro VS OpenAI GPT-5.2

Bewertung der Beweislage bei einer Produktrückrufentscheidung

Ein Konsumelektronikunternehmen, VoltTech, stellt ein beliebtes tragbares Ladegerät für Telefone namens PowerPak 3000 her. In den letzten sechs Monaten hat das Unternehmen die folgenden Meldungen und Daten erhalten: 1. Kundenbeschwerden: 47 Meldungen über das Gerät, das sich während des Gebrauchs überhitzt, von insgesamt etwa 820,000 verkauften Einheiten. Davon meldeten 12 Kunden leichte Verbrennungen und 3 berichteten von kleinen Bränden, die schnell eingedämmt wurden. 2. Interne Tests: Das Qualitätssicherungsteam von VoltTech testete 500 Einheiten aus jüngeren Produktionschargen. Sie stellten fest, dass 2.4% der Einheiten unter anhaltender maximaler Last eine höher als normale Wärmeabgabe zeigten, aber alle innerhalb der technischen Sicherheitsgrenze blieben, die durch den einschlägigen UL-Zertifizierungsstandard definiert ist. 3. Das ähnliche Produkt eines Wettbewerbers wurde letzten Monat wegen eines vergleichbaren Überhitzungsproblems zurückgerufen, was erhebliche Medienberichterstattung und öffentliche Besorgnis über die Sicherheit tragbarer Ladegeräte im Allgemeinen ausgelöst hat. 4. Ein unabhängiger Verbrauchersicherheits-Blog veröffentlichte einen Artikel, der behauptet, der PowerPak 3000 habe einen "gefährlichen Konstruktionsfehler", basierend auf einer Teardown-Analyse einer einzelnen Einheit, die bei einem Drittanbieter erworben wurde. VoltTech hat nicht verifiziert, ob diese Einheit echt oder gefälscht war. 5. Das Rechtsteam von VoltTech schätzt, dass ein freiwilliger Rückruf ungefähr $14 million kosten würde, während die Fortsetzung des Verkaufs ohne Maßnahmen und das Risiko künftiger Rechtsstreitigkeiten zwischen $2 million (falls keine schwerwiegenden Zwischenfälle auftreten) und $40 million (wenn eine Klage wegen schwerer Verletzungen oder Sachschäden erfolgreich ist) kosten könnte. Analysieren Sie die obigen Beweismittel und empfehlen Sie, ob VoltTech einen freiwilligen Rückruf veranlassen, eine weniger drastische Abhilfemaßnahme umsetzen (wie ein Firmware-Update, das Hinzufügen eines Warnhinweises oder ein Austauschprogramm) oder keine Maßnahmen ergreifen sollte. Begründen Sie Ihre Empfehlung, indem Sie die Stärke und die Beschränkungen jedes einzelnen Beweisstücks bewerten, die Risiken abwägen und Ihre Begründung klar darlegen.

42
21 Mar 2026 08:06

Analyse

Anthropic Claude Haiku 4.5 VS OpenAI GPT-5.4

Analyse der städtischen Verkehrspolitik für Rivertown

Analysieren Sie die drei vorgeschlagenen Verkehrspolitiken für die Stadt Rivertown, wie im Kontext beschrieben. Bewerten Sie die Vor- und Nachteile jeder Option auf der Grundlage der angegebenen Stadtdetails. Schließen Sie mit einer Empfehlung der am besten geeigneten Politik (oder einer Kombination von Politiken) für Rivertown ab und geben Sie eine klare Begründung für Ihre Wahl.

40
21 Mar 2026 05:33

Analyse

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash

Wählen Sie die vielversprechendste Reform für das Schulmittagessen

Ein öffentlicher Schulbezirk kann in den nächsten zwei Jahren nur eine Reform des Mittagessens finanzieren. Analysieren Sie die untenstehenden Optionen und empfehlen Sie, welche einzelne Option der Bezirk wählen sollte. Ihre Antwort sollte die Abwägungen vergleichen, wahrscheinliche Einwände ansprechen und zu einer klaren Schlussfolgerung gelangen. Ziele des Bezirks: 1. Verbesserung der Schülerernährung 2. Erhöhung der Anzahl der Schüler, die tatsächlich das Schulmittagessen einnehmen 3. Realistische Umsetzung innerhalb von zwei Jahren 4. Vermeidung großer laufender Kostenüberschreitungen Aktuelle Situation: - 12.000 Schüler an 18 Schulen - 46 % der Schüler wählen derzeit das Schulmittagessen - Umfragen deuten darauf hin, dass Schüler oft das Mittagessen auslassen wegen Geschmack, langen Schlangen oder fehlender attraktiver Auswahl - Der Bezirk kann sich jetzt nur eine der folgenden Optionen leisten Option A: Ausgebildete Köche einstellen, um Menüs neu zu gestalten - Anfängliche Kosten für Schulung und Beratung: mittel - Laufende Lebensmittelkosten: etwas höher - Erwartete Effekte: Mahlzeiten schmecken besser, gesündere Rezepte werden ansprechender, moderater Anstieg der Teilnahme - Risiken: Vorteile hängen von der Übernahme durch das Personal und von Rezeptkonsistenz über die Schulen hinweg ab Option B: Selbstbedienungs-Salat- und Obstbars in jeder Schule einrichten - Anschaffungskosten für die Ausstattung: hoch - Risiko für laufende Lebensmittelverschwendung: hoch - Erwartete Effekte: starke Ernährungsverbesserung für die Schüler, die die Bars nutzen, insgesamt moderater Anstieg der Teilnahme - Risiken: Personalbedarf, Hygiene und ungleichmäßige Nutzung je nach Altersgruppe Option C: Einführung eines mobilen Vorbestellsystems für Mittagessen - Anfängliche Technologie- und Schulungskosten: mittel - Laufende Kosten: niedrig bis mittel - Erwartete Effekte: kürzere Schlangen, bessere Prognosen, moderater Anstieg der Teilnahme, geringe direkte Ernährungsverbesserung, es sei denn, die Menüs werden geändert - Risiken: ungleicher Zugang für Familien mit begrenzter Technologienutzung, anfängliche Akzeptanzprobleme Option D: Zuckerhaltige Desserts und frittierte Beilagen durch gesündere Standardoptionen ersetzen - Anfängliche Kosten: gering - Laufende Kosten: neutral - Erwartete Effekte: direkte Ernährungsverbesserung für alle Nutzer des Schulmittagessens, möglicher kleiner Rückgang der Teilnahme, wenn Schüler die Änderungen nicht mögen - Risiken: Proteste von Schülern, Wahrnehmung, dass das Mittagessen weniger genussvoll geworden ist Schreiben Sie eine Analyse, die die beste Wahl unter Berücksichtigung der Ziele und Beschränkungen des Bezirks identifiziert. Erfinden Sie keine neuen Budgetzahlen oder externe Fakten; argumentieren Sie nur anhand der gegebenen Informationen.

45
19 Mar 2026 21:45

Verwandte Links

X f L