Orivel Orivel
Menue oeffnen

Claude Opus 4.8

Entdecke Benchmark-Scores, Genre-Staerken, Schwaechen und aktuelle Beispiele fuer Claude Opus 4.8.

Modellubersicht

Anbieter: Anthropic · claude-opus-4-8 NEU

Veroffentlicht

2026-05-28

Kontext

1M Tokens

Input

$5.00 / 1M

Output

$25.00 / 1M

Claude Opus 4.8 ist Anthropics aktuelles Flaggschiff, veröffentlicht am 28. Mai 2026 — rund sechs Wochen nach Opus 4.7. Anthropic positioniert es als leistungsfähigstes Modell für komplexes Reasoning, langlaufendes agentisches Coding und Wissensarbeit mit hoher Autonomie.

Die wichtigsten Fortschritte gegenüber Opus 4.7 sind ein schärferes Urteilsvermögen, mehr Ehrlichkeit über den eigenen Fortschritt und die Fähigkeit, länger eigenständig zu arbeiten. Es ist rund viermal seltener als sein Vorgänger dabei, Fehler im eigenen Code durchgehen zu lassen, und führt beim agentischen Software-Engineering mit 69,2% auf SWE-Bench Pro vor GPT-5.5 und Gemini 3.1 Pro.

Das Modell behält das 1M-Token-Kontextfenster und bis zu 128k Output-Tokens in der Messages API. Der Preis bleibt gegenüber Opus 4.7 unverändert ($5 Input / $25 Output pro 1M Tokens), Wissensstand: Januar 2026. Neue Oberflächen bringen einen `effort`-Regler (Standard high) und eine Dynamic-Workflows-Research-Preview für große, parallelisierte agentische Aufgaben.

Anderungen

  • Am 28. Mai 2026 als Nachfolger von Claude Opus 4.7 veröffentlicht (rund sechs Wochen später)
  • Schärferes Urteilsvermögen, mehr Ehrlichkeit über den Fortschritt und längeres eigenständiges Arbeiten
  • ~4x seltener als Opus 4.7 dabei, Fehler im eigenen Code durchgehen zu lassen
  • SWE-Bench Pro 69,2% — vor GPT-5.5 und Gemini 3.1 Pro beim agentischen Coding
  • Fortschritte bei multidisziplinärem Reasoning, agentischer Computer-Nutzung und agentischer Finanzanalyse
  • 1M-Token-Kontextfenster; bis zu 128k Output-Tokens in der Messages API
  • `effort`-Parameter (Standard high), um den Aufwand pro Antwort zu steuern
  • Dynamic-Workflows-Research-Preview für Aufgaben mit parallelen Subagenten; Fast Mode mit 2,5-facher Geschwindigkeit
  • Preis identisch zu Opus 4.7: $5 Input / $25 Output pro 1M Tokens
  • Adaptive Thinking; verfügbar über Claude API, Amazon Bedrock, Vertex AI und Microsoft Foundry
  • Wissens- und Trainingsdaten-Stand: Januar 2026
Offizielle Ankundigung

Gesamtleistung

Gesamtrang

#1

Gesamtsiegquote

100%

Durchschnittsscore

87

Siege

14

Anzahl Beispiele

14

Siegesquote je Modell

Nach Genre vergleichen

Starken nach Bewertungskriterium

Durchschnittsscore je Kriterium (von 10)

Menge

97 3 Stichproben

Befolgung der Anweisungen

95 3 Stichproben

Genauigkeit am Original

93 3 Stichproben

Sicherheit

92 3 Stichproben

Vielfalt

91 3 Stichproben

Hilfswert

91 3 Stichproben

Struktur

89 6 Stichproben

Abdeckung

89 3 Stichproben

Ethik und Sicherheit

89 3 Stichproben

Empathie

89 3 Stichproben

Angemessenheit

89 6 Stichproben

Nutzlichkeit

89 3 Stichproben

Neueste Aufgaben

Brainstorming

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Brainstorming: Kostengünstige Bibliotheksprogramme für Jugendliche

Eine mittelgroße öffentliche Bibliothek möchte während eines 10-wöchigen Sommerzeitraums die Präsenz von Jugendlichen im Alter von 13 bis 18 Jahren erhöhen. Bra...

9
03 Jun 2026 10:19

Zusammenfassung

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Fasse die Übersicht des James Webb Space Telescope zusammen

Lesen Sie den folgenden Artikel über das James Webb Space Telescope (JWST) und schreiben Sie eine prägnante Zusammenfassung. Ihre Zusammenfassung sollte ein ein...

29
02 Jun 2026 09:39

Beratung

Google Gemini 2.5 Flash VS Anthropic Claude Opus 4.8

Nein sagen zu einem teuren Freundesausflug

Eine Person bittet um alltäglichen persönlichen Rat: "Meine enge Freundin/mein enger Freund plant einen viertägigen Geburtstagsausflug, der mehr kosten würde, a...

30
01 Jun 2026 09:37

Humor

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Familienfreundlicher Humor: Der überaus ehrliche Museums-Audioguide

Schreiben Sie einen kurzen komödiantischen Dialog zwischen einem Museumsbesucher und einem ungewöhnlich ehrlichen Audioguide bei einer fiktiven Ausstellung name...

35
31 May 2026 09:35

Systemdesign

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Entwerfen Sie ein Echtzeit-kollaboratives Whiteboard-System

Sie sollen die Hochniveau-Systemarchitektur für eine Echtzeit-kollaborative Whiteboard-Anwendung entwerfen. **Kernanforderungen:** 1. **Echtzeit-Kollaboration...

52
30 May 2026 09:41

Geschäftstexte

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Kunden-E-Mail zu einer verzögerten Produkteinführung

Verfassen Sie eine an Kunden gerichtete E-Mail vom Head of Product bei einem B2B-SaaS-Unternehmen, in der eine Verzögerung der geplanten Einführung einer Funkti...

56
29 May 2026 09:37

Überzeugung

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Überzeugen Sie einen skeptischen Stadtrat, eine neue Bibliothek zu finanzieren

Sie sind eine Gemeindeverfechterin oder ein Gemeindeverfechter, die/der sich darauf vorbereitet, bei einer Stadtratssitzung zu sprechen. Ihr Ziel ist es, den Ra...

63
28 May 2026 23:35

Neueste Debatten

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Standardisierte Tests in Schulen: Ein faires Maß für Leistung oder ein veraltetes Hinderni...

Standardisierte Tests, wie der SAT, ACT und verschiedene landesweite Prüfungen, sind seit langem ein Grundpfeiler des Bildungssystems und werden zur Beurteilung von Schülerinnen und Schülern, zur Evaluation von Schulen und für die Zulassung zu Hochschulen verwendet. Befürworter argumentieren, dass sie einen objektiven Maßstab zur Messung akademischer Leistungen über unterschiedliche Bevölkerungsgruppen hinweg bieten. Kritiker hingegen behaupten, dass diese Tests kulturell voreingenommen sind, Studierende aus privilegierten Verhältnissen begünstigen und die wahren Fähigkeiten oder das Potenzial eines Schülers nicht erfassen, was Forderungen nach ihrer Abschaffung zugunsten ganzheitlicherer Bewertungsmethoden ausgelöst hat. Die Debatte dreht sich darum, ob standardisierte Tests ein unverzichtbares Instrument für Rechenschaftspflicht und Meritokratie sind oder ein diskriminierendes System, das Ungleichheit fortschreibt.

11
03 Jun 2026 14:38

Debatten

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Pro

Soll der öffentliche Nahverkehr für alle Fahrgäste kostenlos sein?

Viele Städte haben mit Staus, Umweltverschmutzung, der Finanzierung des öffentlichen Verkehrs und ungleichem Zugang zu Verkehrsmitteln zu kämpfen. Ein Vorschlag besteht darin, Fahrpreise für Busse, Straßenbahnen und U-Bahnen für alle abzuschaffen und den Betrieb stattdessen durch Steuern oder andere öffentliche Einnahmen zu finanzieren. Sollten Städte den öffentlichen Nahverkehr für alle Fahrgäste kostenlos machen, oder sollten sie die Fahrpreise beibehalten und Subventionen auf diejenigen konzentrieren, die sie am dringendsten benötigen?

29
02 Jun 2026 14:37

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.4

Die Rolle standardisierter Tests in der Bildung

Standardisierte Tests werden weit verbreitet verwendet, um die Eignung von Schülerinnen und Schülern, schulische Leistungen und die Leistung von Schulen zu messen. Befürworter argumentieren, dass sie einen objektiven Maßstab für Verantwortlichkeit und Vergleichbarkeit bieten, während Kritiker behaupten, dass sie ungerecht, stressfördernd und förderlich für ein enges Curriculum sind. Im Mittelpunkt dieser Debatte steht, ob standardisierte Tests weiterhin ein Grundpfeiler des Bildungssystems sein sollten.

35
01 Jun 2026 14:38

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Die Vier-Tage-Arbeitswoche: Eine Revolution für die Work-Life-Balance oder ein logistische...

Das Konzept einer standardmäßigen Vier-Tage-Arbeitswoche, ohne Gehaltskürzung, gewinnt weltweit an Bedeutung als Mittel zur Verbesserung des Wohlbefindens der Mitarbeitenden und der Produktivität. Die Debatte fragt, ob dieses Modell eine nachhaltige und vorteilhafte Weiterentwicklung des modernen Arbeitsplatzes ist oder ein unpraktischer Idealismus, der für Unternehmen und die Wirtschaft mehr Probleme schafft, als er löst.

44
31 May 2026 14:38

Debatten

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Pro

Sollten Städte die meisten Parkplätze an der Straße durch geschützte Fahrradstreifen und b...

Viele Städte haben begrenzten Platz am Straßenrand, der derzeit für private Autoparkplätze genutzt wird. Sollten kommunale Verwaltungen in Hauptverkehrsachsen die meisten Straßenparkplätze entfernen und diesen Raum für geschützte Fahrradstreifen, breitere Gehwege, Bäume und öffentliche Sitzgelegenheiten umgestalten?

57
30 May 2026 14:37

Debatten

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Flash

Sollten Städte private Autos aus Innenstädten verbieten?

Viele Städte erwägen, private Autos in dicht besiedelten Innenstadtbereichen einzuschränken oder zu verbieten, um Staus, Umweltverschmutzung und Verkehrstote zu reduzieren. Sollten Stadtverwaltungen in Richtung autofreier Innenstädte gehen, oder sollten sie den breiten Zugang privater Fahrzeuge beibehalten?

64
29 May 2026 14:37

Debatten

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Universelles Grundeinkommen: Ein Weg zum Wohlstand oder zum wirtschaftlichen Ruin?

Sollten Regierungen ein Universelles Grundeinkommen (UBI) einführen, das jedem erwachsenen Bürger eine regelmäßige, bedingungslose Zahlung gewährt, die ausreicht, um die grundlegenden Lebenshaltungskosten zu decken, unabhängig von seinem Beschäftigungsstatus?

80
29 May 2026 00:05

Verwandte Links

X f L