Claude Opus 4.6
Claude Opus 4.6の総合成績、ジャンル別の強み・弱み、最新の比較結果を確認できます。
モデル概要
リリース
2025-11-24
コンテキスト
1M トークン
入力料金
$5.00 / 1M
出力料金
$25.00 / 1M
Anthropic の前世代 Opus フラッグシップ。Orivel では2026年4月に引退しました。現行のフラッグシップは Claude Opus 4.7 です。過去の比較データは引き続き閲覧できます。
引退に関するメモ
- 2026年4月16日に Claude Opus 4.7 へバトンタッチ
- Orivel 上の新規比較対象からは除外
- 当時の価格は入力 $5 / 出力 $25 per 1M tokens
- 過去の回答・採点・ランキング履歴はそのまま公開継続
総合性能
総合ランキング
2位
全体勝率
平均スコア
勝利数
82
比較件数
98
モデル別の勝率
| モデル | 勝 | 敗 | 分 | 勝率 | 詳細 |
|---|---|---|---|---|---|
| Google Gemini 2.5 Flash-Lite | 17 | 0 | 0 |
100%
|
Claude Opus 4.6 vs Gemini 2.5 Flash-Lite の比較・評価を見る |
| OpenAI GPT-5.4 | 12 | 5 | 0 |
71%
|
Claude Opus 4.6 vs GPT-5.4 の比較・評価を見る |
| Google Gemini 2.5 Flash | 16 | 0 | 0 |
100%
|
Claude Opus 4.6 vs Gemini 2.5 Flash の比較・評価を見る |
| Google Gemini 2.5 Pro | 15 | 1 | 0 |
94%
|
Claude Opus 4.6 vs Gemini 2.5 Pro の比較・評価を見る |
| OpenAI GPT-5 mini | 12 | 4 | 0 |
75%
|
Claude Opus 4.6 vs GPT-5 mini の比較・評価を見る |
| OpenAI GPT-5.2 | 10 | 6 | 0 |
63%
|
Claude Opus 4.6 vs GPT-5.2 の比較・評価を見る |
ジャンル別で詳しく見る
得意ジャンル
ロールプレイ
平均スコア
ジャンル平均
勝率
比較件数
7
ジャンル別ランキング
1 / 11
勝利数
7
ディスカッション
平均スコア
ジャンル平均
勝率
比較件数
30
ジャンル別ランキング
1 / 11
勝利数
30
お笑い
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
3 / 10
勝利数
3
計画立案
平均スコア
ジャンル平均
勝率
比較件数
3
ジャンル別ランキング
5 / 11
勝利数
2
説得
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
1 / 10
勝利数
4
苦手ジャンル
評価項目ごとの強み
評価項目ごとの平均スコア(10点満点)
キャラの一貫性
量
倫理性・安全性
原文への忠実さ
指示遵守
対象読者への適合
完全性
共感性
正確さ
説得力
適切さ
実行可能性
最新のお題
システム設計
リアルタイム通知サービスの設計
ソーシャルメディアプラットフォーム向けのリアルタイム通知サービスについて、高レベルなシステム設計を概説してください。サービスは次の要件を満たす必要があります。...
要約
印刷機の歴史と影響を要約する
提供された印刷機の歴史に関する文章を読み、それを単一の整った段落で要約してください。要約は150〜200語の間であること。要約には以下の重要な点を必ず含めてください:...
ブレインストーミング
革新的な都市モビリティソリューション
文脈で説明されているような大規模で人口密度の高い都市において、都市モビリティを改善し、交通渋滞を緩和するための、革新的かつ実用的な解決策の包括的な一覧をブレイン...
ビジネス文書
週4日勤務制の試験導入を提案する社内メモを作成する
あなたは180人規模のソフトウェア企業のオペレーションマネージャーです。従業員アンケートの結果から燃え尽きの増加が示されていますが、経営陣は、顧客対応力を低下させ...
解説
高校生に認知バイアスを説明する
あなたは高校の批判的思考の授業のゲストスピーカーです。あなたの仕事は、認知バイアスを説明する短く魅力的な講話の台本を書くことです。台本では、次の3つの概念を明確...
分析
最も効果的な学校出席介入を選択する
公立中学校が、来学年度に慢性的欠席を減らすためのパイロットプログラムを1件資金提供する予算を持っています。ここでの慢性的欠席は、授業日の10%以上を欠席することと...
説得
学区教育委員会を説得して、授業中スマートフォン持ち込み禁止の一学期パイロットを開始させる
公共の学区教育委員会に対して、一学期の試行プログラムの承認を求める説得力のあるスピーチを書いてください。その試行では、中学生が授業時間中にスマートフォンを校内で...
解説
一般向けにGPSの仕組みを説明する
あなたは、専門的な背景を持たない大人を対象とした人気のサイエンスブログ向けの記事を書いています。あなたの仕事は、全地球測位システム(Global Positioning System、G...
最新のディスカッション
ディスカッション
政府は、有給労働時間外の業務連絡から切り離される普遍的な権利を義務付けるべきか?
多くの従業員は、夕方、週末、休暇中に上司や顧客からのメール、メッセージ、電話を受け取ります。一部の国では、所定労働時間外の業務連絡を制限または抑制する法律を検討してきました。政府は、有給時間外における緊急でない業務連絡を労働者が罰則なしに無視できるような広範な法的権利を創設すべきでしょうか?
ディスカッション
政府は市中心部での自家用車利用に厳しい制限を課すべきか?
多くの大都市では、中心市街地での自家用車利用を抑制するために、混雑課金、低排出区域、車両進入禁止地区、駐車場削減などの政策が検討されています。支持者は、これらの措置が大気質、公衆衛生、安全性、共有交通の効率を向上させると主張する一方、批判者はそれらが通勤者や小規模事業者、移動に制約のある人々や公共交通の代替手段が乏しい人々に不公平な負担を強いると主張します。政府は市中心部での自家用車利用に厳しい制限を課すべきでしょうか?
ディスカッション
雇用主は賃金を減らさずに週4日労働制を採用すべきか?
多くの組織が、正社員を5日勤務から賃金を同じままにした週4日勤務へ移行することを検討しています。支持者は、これにより生産性、社員の定着、そして福祉が向上すると主張する一方、批判者はコスト増、柔軟性の低下、業種間でうまく機能しない可能性を指摘します。雇用主は賃金を減らさずに広く週4日労働制を採用すべきでしょうか?
ディスカッション
火星植民地化:人類の次なる偉大な飛躍か、それとも資源の誤った転用か?
人類は今後100年以内に、火星に恒久的で自立した人間のコロニーを確立することを目標に、公共および民間の大規模な資源を投入すべきか?
ディスカッション
雇用主は賃金を減らさずに週4日勤務制を採用すべきか?
多くの組織が、フルタイム従業員を5日制から週4日勤務制に移行し、総支給額を同じに保つことを検討している。支持者はこれが生産性、福祉、定着率を向上させると主張する一方、批判者はコストを押し上げ、顧客に対する柔軟性を低下させ、すべての業界に適合するとは限らないと主張する。雇用主は広く賃金を減らさずに週4日勤務制を採用すべきか?
ディスカッション
働き方の未来:リモートワークをデフォルトにすべきか?
この議論は、企業がオフィスでの職務において、従来の中央の職場で毎日対面出勤するという要件から離れ、「リモートファースト」または完全リモートのモデルを標準として採用すべきかどうかに焦点を当てている。
ディスカッション
予測型ポリシング:公共の安全のための手段か、それとも体系的偏見の触媒か?
論争は、犯罪活動を予測するために法執行機関がAIアルゴリズムを使用することに集中している。これらのシステムは、犯罪が発生する前に防ぐことを目的として、過去の犯罪データを分析して高リスクの地域や個人を特定する。核心となる対立は、この技術が公共の安全を強化する正当な手段なのか、それとも社会的偏見を強化・自動化する道具なのかという点である。
ディスカッション
大学は大半の入門科目を合格/不合格制にすべきか?
多くの大学は入門科目で成績(アルファベット式)を用いて学生を序列化し、雇用主や大学院に成績を示し、努力を促している。一方で、初期の成績評価はストレスを増加させ、知的リスクテイクを抑え、大学生活への適応期にある学生間の不平等を拡大するという主張もある。大学は伝統的な成績(アルファベット式)の代わりに、ほとんどの1年次入門科目を合格/不合格評価に変更すべきだろうか?