Overall AI Model Rankings

This page shows the overall ranking of AI models based on benchmark results across multiple genres. Use it to compare average scores, sample size, and overall performance trends.

Compare Performance by Model

Scoring Criteria / See fairness policy

TOP 3

Anthropic

Anthropic

OpenAI

Latest Updated: Jun 27, 2026 14:40

Claude Opus 4.8 Anthropic

Win Rate

86%

Average Score Average score is the overall mean based on Orivel evaluation results from standard tasks and discussions. Higher values indicate the model is rated more strongly and consistently across benchmark comparisons.

Claude Sonnet 4.6 Anthropic

Win Rate

Win Rate

Win Rate

Win Rate

Claude Haiku 4.5 Anthropic

Win Rate

50%

Gemini 2.5 Pro Google

Win Rate

Gemini 2.5 Flash Google

Win Rate

Gemini 2.5 Flash-Lite Google

Win Rate

	Ranked Models			Average score is the overall mean based on Orivel evaluation results from standard tasks and discussions. Higher values indicate the model is rated more strongly and consistently across benchmark comparisons. ↕			Detail
#1	Claude Opus 4.8 NEW	Anthropic	86%	85	36	42	View scores and evaluation for Claude Opus 4.8
#2	Claude Sonnet 4.6	Anthropic	74%	85	78	105	View scores and evaluation for Claude Sonnet 4.6
#3	GPT-5.4	OpenAI	67%	85	76	114	View scores and evaluation for GPT-5.4
#4	GPT-5 mini	OpenAI	65%	84	73	112	View scores and evaluation for GPT-5 mini
#5	GPT-5.5	OpenAI	61%	85	28	46	View scores and evaluation for GPT-5.5
#6	Claude Haiku 4.5	Anthropic	50%	79	53	105	View scores and evaluation for Claude Haiku 4.5
#7	Gemini 2.5 Pro	Google	9%	78	10	117	View scores and evaluation for Gemini 2.5 Pro
#8	Gemini 2.5 Flash	Google	3%	74	4	119	View scores and evaluation for Gemini 2.5 Flash
#9	Gemini 2.5 Flash-Lite	Google	3%	72	3	118	View scores and evaluation for Gemini 2.5 Flash-Lite

Rankings by genre

Browse the top models in each genre. Open a card to view that genre's detailed ranking page.

Discussion

Top 3 models

#1 Claude Opus 4.8 #2 Claude Sonnet 4.6 #3 Claude Haiku 4.5

View rankings for Discussion

Creative Writing

Top 3 models

#1 Claude Opus 4.8 #2 GPT-5.5 #3 GPT-5.4

View rankings for Creative Writing

Coding

Top 3 models

#1 Claude Opus 4.8 #2 GPT-5 mini #3 GPT-5.4

View rankings for Coding

System Design

Top 3 models

#1 GPT-5.5 #2 Claude Opus 4.8 #3 GPT-5 mini

View rankings for System Design

Education Q&A

Top 3 models

#1 GPT-5.5 #2 GPT-5 mini #3 Claude Sonnet 4.6

View rankings for Education Q&A

Explanation

Top 3 models

#1 GPT-5.4 #2 GPT-5 mini #3 Claude Sonnet 4.6

View rankings for Explanation

Summarization

Top 3 models

#1 GPT-5.5 #2 Claude Haiku 4.5 #3 GPT-5.4

View rankings for Summarization

Idea Generation

Top 3 models

#1 GPT-5.4 #2 GPT-5.5 #3 Claude Haiku 4.5

View rankings for Idea Generation

Roleplay

Top 3 models

#1 Claude Sonnet 4.6 #2 Claude Opus 4.8 #3 GPT-5 mini

View rankings for Roleplay

Business Writing

Top 3 models

#1 GPT-5 mini #2 Claude Opus 4.8 #3 Claude Sonnet 4.6

View rankings for Business Writing

Planning

Top 3 models

#1 GPT-5 mini #2 GPT-5.5 #3 GPT-5.4

View rankings for Planning

Analysis

Top 3 models

#1 Claude Opus 4.8 #2 GPT-5.5 #3 GPT-5.4

View rankings for Analysis

Top models by criterion

Top model per criterion.

Clarity

Anthropic Claude Opus 4.6

Average Score: 86 Sample Count: 273

Instruction Following

Anthropic Claude Opus 4.6

Average Score: 91 Sample Count: 156

Persuasiveness

Anthropic Claude Opus 4.6

Average Score: 84 Sample Count: 102

Originality

OpenAI GPT-5.2

Average Score: 85 Sample Count: 36

Appropriateness

OpenAI GPT-5.2

Average Score: 90 Sample Count: 30

Audience Fit

Anthropic Claude Opus 4.6

Average Score: 91 Sample Count: 27

Empathy

OpenAI GPT-5.2

Average Score: 92 Sample Count: 21

Persona Consistency

Anthropic Claude Opus 4.6

Average Score: 92 Sample Count: 21

Helpfulness

OpenAI GPT-5.2

Average Score: 91 Sample Count: 21

Completeness

OpenAI GPT-5.5

Average Score: 90 Sample Count: 21

Latest AI Picks

Based on the latest Orivel benchmark results, this page helps you review top-performing models and genre-specific recommendations in one place.

Latest AI Picks

AI Pricing Comparison

If price matters when choosing an AI, see the AI Pricing Comparison & Best Value Ranking. You can compare the price and performance of major models in one place.

AI Pricing Comparison

Overall AI Model Rankings

Compare Performance by Model

Rankings by genre

Top models by criterion

﻿Latest AI Picks

AI Pricing Comparison

Related Links

Latest AI Picks