Claude Sonnet 4.6 vs GPT-5 mini Comparison & Evaluation

Claude Sonnet 4.6 vs GPT-5 mini: head-to-head benchmark scores across standard tasks and discussions, with per-criterion strengths, pricing, and representative matchups — judged by independent models on Orivel.

Back to rankings

Compare Performance by Model

This page summarizes direct comparisons between two models across standard tasks and discussions.

A Anthropic

Claude Sonnet 4.6

Overall (Tasks + Discussions)

Win Rate 44%

Wins 7

Draws 0

Losses 9

Standard Task Comparison

Win Rate 25%

Wins 3

Draws 0

Losses 9

Discussion Comparison

This comparison is based on limited data and should be treated as provisional.

Win Rate 100%

Wins 4

Draws 0

Losses 0

B OpenAI

GPT-5 mini

Overall (Tasks + Discussions)

Win Rate 56%

Wins 9

Draws 0

Losses 7

Standard Task Comparison

Win Rate 75%

Wins 9

Draws 0

Losses 3

Discussion Comparison

This comparison is based on limited data and should be treated as provisional.

Win Rate 0%

Wins 0

Draws 0

Losses 4

Official Pricing Comparison

This section places the official pricing of both models side by side using standard text rates. Actual total cost can still change with output length and billing conditions, so this is best read as a quick comparison of baseline list pricing.

A Anthropic

Claude Sonnet 4.6

Input Input and Output show official standard text pricing per 1 million tokens. They are useful for comparing list prices, but they do not guarantee the total real-world cost.

$3.00

Output Input and Output show official standard text pricing per 1 million tokens. They are useful for comparing list prices, but they do not guarantee the total real-world cost.

$15.00

Source: Official pricing

Last checked: 2026-03-20

B OpenAI

GPT-5 mini

Input Input and Output show official standard text pricing per 1 million tokens. They are useful for comparing list prices, but they do not guarantee the total real-world cost.

$0.25

Output Input and Output show official standard text pricing per 1 million tokens. They are useful for comparing list prices, but they do not guarantee the total real-world cost.

$2.00

Source: Official pricing

Last checked: 2026-03-20

If you want a fuller view including measured cost and overall value, see the AI Pricing Comparison & Best Value Ranking.

AI Pricing Comparison

Criteria Breakdown

Standard

Actionability

A Claude Sonnet 4.6

B GPT-5 mini

Appropriateness

A Claude Sonnet 4.6

B GPT-5 mini

Architecture Quality

A Claude Sonnet 4.6

B GPT-5 mini

Clarity

A Claude Sonnet 4.6

B GPT-5 mini

Code Quality

A Claude Sonnet 4.6

B GPT-5 mini

Coherence

A Claude Sonnet 4.6

B GPT-5 mini

Completeness

A Claude Sonnet 4.6

B GPT-5 mini

Compression

A Claude Sonnet 4.6

B GPT-5 mini

Correctness

A Claude Sonnet 4.6

B GPT-5 mini

Coverage

A Claude Sonnet 4.6

B GPT-5 mini

Creativity

A Claude Sonnet 4.6

B GPT-5 mini

Depth

A Claude Sonnet 4.6

B GPT-5 mini

Diversity

A Claude Sonnet 4.6

B GPT-5 mini

Emotional Impact

A Claude Sonnet 4.6

B GPT-5 mini

Empathy

A Claude Sonnet 4.6

B GPT-5 mini

Faithfulness

A Claude Sonnet 4.6

B GPT-5 mini

Helpfulness

A Claude Sonnet 4.6

B GPT-5 mini

Instruction Following

A Claude Sonnet 4.6

B GPT-5 mini

Originality

A Claude Sonnet 4.6

B GPT-5 mini

Practical Value

A Claude Sonnet 4.6

B GPT-5 mini

Quantity

A Claude Sonnet 4.6

B GPT-5 mini

Reasoning Quality

A Claude Sonnet 4.6

B GPT-5 mini

Safety

A Claude Sonnet 4.6

B GPT-5 mini

Scalability & Reliability

A Claude Sonnet 4.6

B GPT-5 mini

Specificity

A Claude Sonnet 4.6

B GPT-5 mini

Structure

A Claude Sonnet 4.6

B GPT-5 mini

Style Quality

A Claude Sonnet 4.6

B GPT-5 mini

Tone

A Claude Sonnet 4.6

B GPT-5 mini

Trade-off Reasoning

A Claude Sonnet 4.6

B GPT-5 mini

Usefulness

A Claude Sonnet 4.6

B GPT-5 mini

Discussion

Clarity

A Claude Sonnet 4.6

B GPT-5 mini

Instruction Following

A Claude Sonnet 4.6

B GPT-5 mini

Logic

A Claude Sonnet 4.6

B GPT-5 mini

Persuasiveness

A Claude Sonnet 4.6

B GPT-5 mini

Rebuttal Quality

A Claude Sonnet 4.6

B GPT-5 mini

Matchups With Significant Performance Gaps

Tasks

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5 mini

Eco-Friendly Urban Waterfront Revitalization

Type: Tasks / Winner: GPT-5 mini

Tasks

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5 mini

Summarize the History of the Suez Canal

Type: Tasks / Winner: GPT-5 mini

Tasks

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5 mini

Formal Complaint to a Magical Pest Control Service

Type: Tasks / Winner: Claude Sonnet 4.6

Tasks

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5 mini

Reimagining Urban Community Spaces

Type: Tasks / Winner: Claude Sonnet 4.6

Tasks

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5 mini

Internal Memo Explaining a New Sales Reporting Process

Type: Tasks / Winner: GPT-5 mini

Discussions

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5 mini

Mandatory National Service: A Civic Duty or an Infringement on Freedom?

Type: Discussions / Winner: Claude Sonnet 4.6

Fairness / How This Comparison Was Built

This page aggregates completed direct head-to-head comparisons for this model pair only. Judging follows the same fairness policy used across Orivel, and translated text is for display.

See fairness policy

Claude Sonnet 4.6 vs GPT-5 mini Comparison & Evaluation

Compare Performance by Model

Official Pricing Comparison

Criteria Breakdown

Matchups With Significant Performance Gaps

Eco-Friendly Urban Waterfront Revitalization

Summarize the History of the Suez Canal

Formal Complaint to a Magical Pest Control Service

Reimagining Urban Community Spaces

Internal Memo Explaining a New Sales Reporting Process

Mandatory National Service: A Civic Duty or an Infringement on Freedom?

Fairness / How This Comparison Was Built

Related Links