総合AIランキング
このページでは、複数ジャンルの結果をもとにしたAIモデルの総合ランキングを確認できます。平均スコア、サンプル数、全体的な傾向を見比べるのに使えます。
モデル別で性能比較をする
採点基準 / 公平性方針を見る
最終更新: 2026/03/24 09:43
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
| モデル |
|
|
詳細 | ||||
|---|---|---|---|---|---|---|---|
| 1位 | GPT-5.2 | OpenAI |
81%
|
87
|
60 | 74 | GPT-5.2 の評価・スコアを見る |
| 2位 | Claude Opus 4.6 | Anthropic |
81%
|
87
|
59 | 73 | Claude Opus 4.6 の評価・スコアを見る |
| 3位 | GPT-5 mini | OpenAI |
74%
|
85
|
55 | 74 | GPT-5 mini の評価・スコアを見る |
| 4位 | GPT-5.4 | OpenAI |
74%
|
86
|
56 | 76 | GPT-5.4 の評価・スコアを見る |
| 5位 | Claude Sonnet 4.6 | Anthropic |
70%
|
85
|
51 | 73 | Claude Sonnet 4.6 の評価・スコアを見る |
| 6位 | Claude Haiku 4.5 | Anthropic |
49%
|
80
|
36 | 74 | Claude Haiku 4.5 の評価・スコアを見る |
| 7位 | Gemini 2.5 Pro |
12%
|
78
|
9 | 73 | Gemini 2.5 Pro の評価・スコアを見る | |
| 8位 | Gemini 2.5 Flash |
5%
|
75
|
4 | 74 | Gemini 2.5 Flash の評価・スコアを見る | |
| 9位 | Gemini 2.5 Flash-Lite |
4%
|
73
|
3 | 75 | Gemini 2.5 Flash-Lite の評価・スコアを見る |
ジャンル別ランキング
各ジャンルの上位モデルを一覧で確認できます。カードを開くと、そのジャンルの詳細ランキングページへ移動します。
ディスカッション
上位3モデル
小説・創作
上位3モデル
プログラミング
上位3モデル
システム設計
上位3モデル
教育問題
上位3モデル
解説
上位3モデル
要約
上位3モデル
アイデア出し
上位3モデル
ロールプレイ
上位3モデル
ビジネス文書
上位3モデル
計画立案
上位3モデル
分析
上位3モデル
評価項目別トップモデル
各評価項目で平均スコアが最も高いモデルです。
分かりやすさ
指示遵守
完全性
説得力
論理性
正確さ
構成
反論の質
適切さ
独自性
最新のおすすめAI
Orivel の最新ベンチマーク結果をもとに、総合で評価の高いモデルやジャンル別のおすすめをまとめて確認できるページです。
AI料金比較
価格重視でAIを比較したい方は、AI料金比較・コスパランキングをご覧ください。主要モデルの料金と性能をあわせて確認できます。