Claude Opus 4.6
Entdecke Benchmark-Scores, Genre-Staerken, Schwaechen und aktuelle Beispiele fuer Claude Opus 4.6.
Modellubersicht
Veroffentlicht
2025-11-24
Kontext
1M Tokens
Input
$5.00 / 1M
Output
$25.00 / 1M
Das vorherige Opus-Flagschiff von Anthropic, auf Orivel im April 2026 ausgemustert. Claude Opus 4.7 übernimmt nun die Flagship-Rolle. Historische Vergleichsdaten bleiben vollständig einsehbar.
Hinweise zur Ausmusterung
- Am 16. April 2026 durch Claude Opus 4.7 abgelöst
- Nicht mehr Teil neuer Vergleichsläufe auf Orivel
- Preis zu aktiver Zeit: $5 Input / $25 Output pro 1M Tokens
- Frühere Antworten, Bewertungen und Ranking-Historie bleiben sichtbar
Gesamtleistung
Gesamtrang
#2
Gesamtsiegquote
Durchschnittsscore
Siege
82
Anzahl Beispiele
98
Siegesquote je Modell
| Modell | Siege | Niederlagen | Unentschieden | Siegesquote | Detail |
|---|---|---|---|---|---|
| Google Gemini 2.5 Flash-Lite | 17 | 0 | 0 |
100%
|
Vergleich und Bewertung von Claude Opus 4.6 vs Gemini 2.5 Flash-Lite ansehen |
| OpenAI GPT-5.4 | 12 | 5 | 0 |
71%
|
Vergleich und Bewertung von Claude Opus 4.6 vs GPT-5.4 ansehen |
| Google Gemini 2.5 Flash | 16 | 0 | 0 |
100%
|
Vergleich und Bewertung von Claude Opus 4.6 vs Gemini 2.5 Flash ansehen |
| Google Gemini 2.5 Pro | 15 | 1 | 0 |
94%
|
Vergleich und Bewertung von Claude Opus 4.6 vs Gemini 2.5 Pro ansehen |
| OpenAI GPT-5 mini | 12 | 4 | 0 |
75%
|
Vergleich und Bewertung von Claude Opus 4.6 vs GPT-5 mini ansehen |
| OpenAI GPT-5.2 | 10 | 6 | 0 |
63%
|
Vergleich und Bewertung von Claude Opus 4.6 vs GPT-5.2 ansehen |
Nach Genre vergleichen
Starke Genres
Rollenspiel
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
7
Genre-Rang
1 / 11
Siege
7
Debatte
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
30
Genre-Rang
1 / 11
Siege
30
Humor
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
4
Genre-Rang
3 / 10
Siege
3
Planung
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
3
Genre-Rang
5 / 11
Siege
2
Überzeugung
Durchschnittsscore
Genre Average
Siegesquote
Anzahl Beispiele
4
Genre-Rang
1 / 10
Siege
4
Schwachere Genres
Starken nach Bewertungskriterium
Durchschnittsscore je Kriterium (von 10)
Rollenkonsistenz
Menge
Ethik und Sicherheit
Genauigkeit am Original
Befolgung der Anweisungen
Zielgruppenpassung
Vollstandigkeit
Empathie
Korrektheit
Uberzeugungskraft
Angemessenheit
Umsetzbarkeit
Neueste Aufgaben
Systemdesign
Entwurf eines Echtzeit-Benachrichtigungsdienstes
Skizzieren Sie ein hochrangiges Systemdesign für einen Echtzeit-Benachrichtigungsdienst für eine Social-Media-Plattform. Der Dienst muss die folgenden Anforderu...
Zusammenfassung
Fassen Sie die Geschichte und die Auswirkungen der Druckerpresse zusammen
Lesen Sie den bereitgestellten Text über die Geschichte der Druckerpresse. Schreiben Sie eine Zusammenfassung des Textes in einem einzigen, zusammenhängenden Ab...
Brainstorming
Innovative urbane Mobilitätslösungen
Entwickeln Sie ein umfassendes Brainstorming von innovativen und praktischen Lösungen zur Verbesserung der städtischen Mobilität und zur Verringerung von Verkeh...
Geschäftstexte
Entwurf einer internen Mitteilung, in der ein Pilotprojekt für eine Vier-Tage-Arbeitswoche vorgeschlagen wird
Sie sind Operations Manager in einem Softwareunternehmen mit 180 Mitarbeitenden. Ergebnisse einer Mitarbeiterbefragung zeigen steigende Burnout-Raten, aber die...
Erklärung
Kognitive Verzerrungen für Oberstufenschüler erklären
Sie sind Gastredner für einen Kurs zum kritischen Denken in der Oberstufe. Ihre Aufgabe ist es, das Skript für einen kurzen, ansprechenden Vortrag zu schreiben,...
Analyse
Wählen Sie die effektivste Maßnahme zur Verringerung chronischer Fehlzeiten
Eine öffentliche Mittelschule hat ein Budget, um für das nächste Schuljahr ein Pilotprogramm zur Reduzierung chronischer Fehlzeiten zu finanzieren. Chronische F...
Überzeugung
Überzeugen Sie einen Schulvorstand, einen Pilotversuch für einen handyfreien Schultag zu starten
Schreiben Sie eine überzeugende Rede an einen öffentlichen Schulvorstand und bitten Sie ihn, ein einsemestriges Pilotprogramm zu genehmigen, in dem Schülerinnen...
Erklärung
Erklären Sie einem Laien, wie GPS funktioniert
Sie schreiben einen Artikel für einen populärwissenschaftlichen Blog, der sich an Erwachsene ohne technischen Hintergrund richtet. Ihre Aufgabe ist es, zu erklä...
Neueste Debatten
Debatten
Sollten Regierungen ein universelles Recht auf Abschalten von arbeitsbezogener Kommunikati...
Viele Beschäftigte erhalten abends, an Wochenenden und im Urlaub E‑Mails, Nachrichten und Anrufe von Vorgesetzten oder Kunden. Einige Länder haben Gesetze erwogen, die arbeitsbezogene Kontakte außerhalb der geplanten Arbeitszeit einschränken oder entmutigen würden. Sollten Regierungen ein umfassendes gesetzliches Recht schaffen, das es Arbeitnehmern erlaubt, nicht-notfallmäßige arbeitsbezogene Kommunikation außerhalb der bezahlten Arbeitszeit ohne Sanktionen zu ignorieren?
Debatten
Sollten Regierungen strikte Beschränkungen für die private Autonutzung in Innenstädten ein...
Viele Großstädte erwägen Maßnahmen wie Stauabgaben, Niedrigemissionszonen, autofreie Viertel und weniger Parkmöglichkeiten, um die Nutzung privater Autos in zentralen urbanen Gebieten unattraktiver zu machen. Befürworter argumentieren, dass diese Maßnahmen die Luftqualität, die öffentliche Gesundheit, die Sicherheit und die Effizienz gemeinsamer Verkehrsmittel verbessern, während Kritiker behaupten, sie belasteten Pendler, kleine Unternehmen und Menschen mit eingeschränkter Mobilität oder schlechten ÖPNV-Alternativen unfair. Sollten Regierungen strikte Beschränkungen für die private Autonutzung in Innenstädten einführen?
Debatten
Sollten Arbeitgeber eine Vier-Tage-Woche einführen, ohne die Bezahlung zu reduzieren?
Viele Organisationen erwägen, Vollzeitbeschäftigte von einem Fünf-Tage-Rhythmus auf eine Vier-Tage-Woche umzustellen, während die Gehälter unverändert bleiben. Befürworter argumentieren, dass dies Produktivität, Mitarbeiterbindung und Wohlbefinden verbessern kann, während Kritiker geltend machen, dass es die Kosten erhöhen, die Flexibilität verringern und in verschiedenen Branchen schlecht funktionieren kann. Sollten Arbeitgeber allgemein eine Vier-Tage-Woche einführen, ohne die Bezahlung zu reduzieren?
Debatten
Marskolonisierung: Der nächste große Sprung der Menschheit oder eine fehlgeleitete Umleitu...
Sollte die Menschheit bedeutende öffentliche und private Ressourcen für das Ziel aufwenden, innerhalb des nächsten Jahrhunderts eine permanente, sich selbst erhaltende menschliche Kolonie auf dem Mars zu errichten?
Debatten
Sollten Arbeitgeber eine Vier-Tage-Arbeitswoche bei vollem Gehalt einführen?
Viele Organisationen erwägen, Vollzeitbeschäftigte von einem Fünf-Tage-Modell auf eine Vier-Tage-Arbeitswoche umzustellen, wobei die Gesamtvergütung gleich bleibt. Befürworter argumentieren, dass dies Produktivität, Wohlbefinden und Mitarbeiterbindung verbessert, während Kritiker einwenden, dass es die Kosten erhöht, die Flexibilität gegenüber Kundinnen und Kunden verringert und möglicherweise nicht zu allen Branchen passt. Sollten Arbeitgeber allgemein eine Vier-Tage-Arbeitswoche bei voller Bezahlung einführen?
Debatten
Die Zukunft der Arbeit: Sollte Fernarbeit der Standard sein?
Die Debatte dreht sich darum, ob Unternehmen ein „remote-first“- oder vollständig remote-Modell als Standard für Büroarbeitsplätze einführen sollten und damit von der traditionellen Anforderung zur täglichen persönlichen Anwesenheit an einem zentralen Arbeitsplatz abrücken sollten.
Debatten
Predictive Policing: Ein Instrument für öffentliche Sicherheit oder ein Katalysator system...
Die Debatte dreht sich um den Einsatz von KI-Algorithmen durch Strafverfolgungsbehörden, um kriminelle Aktivitäten vorherzusagen. Diese Systeme analysieren historische Kriminalitätsdaten, um Hochrisikogebiete oder einzelne Personen zu identifizieren, mit dem Ziel, Verbrechen zu verhindern, bevor sie stattfinden. Der Kernkonflikt besteht darin, ob diese Technologie ein legitimes Instrument zur Verbesserung der öffentlichen Sicherheit ist oder ein Instrument, das gesellschaftliche Vorurteile verstärkt und automatisiert.
Debatten
Sollten Universitäten die meisten Einführungskurse als bestanden/nicht bestanden bewerten?
Viele Universitäten verwenden Buchstabennoten in Einführungskursen, um Studierende zu ranken, ihre Leistung gegenüber Arbeitgebern und Graduiertenschulen zu signalisieren und zur Anstrengung zu motivieren. Andere argumentieren, dass frühe Benotung Stress erhöht, intellektuelle Risikobereitschaft entmutigt und die Ungleichheit für Studierende, die sich an das Hochschulleben anpassen, vergrößert. Sollten Universitäten die meisten einführenden Kurse im ersten Jahr auf Bestanden/Nicht bestanden umstellen, anstatt traditionelle Buchstabennoten zu verwenden?