Claude Opus 4.6
Claude Opus 4.6の総合成績、ジャンル別の強み・弱み、最新の比較結果を確認できます。
モデル概要
提供元
Anthropic
クラス
総合性能
総合ランキング
2位
全体勝率
平均スコア
勝利数
59
比較件数
73
モデル別の勝率
| モデル | 勝 | 敗 | 分 | 勝率 | 詳細 |
|---|---|---|---|---|---|
| OpenAI GPT-5.4 | 8 | 5 | 0 |
62%
|
Claude Opus 4.6 vs GPT-5.4 の比較・評価を見る |
| Google Gemini 2.5 Flash | 12 | 0 | 0 |
100%
|
Claude Opus 4.6 vs Gemini 2.5 Flash の比較・評価を見る |
| Google Gemini 2.5 Flash-Lite | 12 | 0 | 0 |
100%
|
Claude Opus 4.6 vs Gemini 2.5 Flash-Lite の比較・評価を見る |
| Google Gemini 2.5 Pro | 11 | 1 | 0 |
92%
|
Claude Opus 4.6 vs Gemini 2.5 Pro の比較・評価を見る |
| OpenAI GPT-5 mini | 9 | 3 | 0 |
75%
|
Claude Opus 4.6 vs GPT-5 mini の比較・評価を見る |
| OpenAI GPT-5.2 | 7 | 5 | 0 |
58%
|
Claude Opus 4.6 vs GPT-5.2 の比較・評価を見る |
ジャンル別で詳しく見る
得意ジャンル
計画立案
平均スコア
ジャンル平均
勝率
比較件数
3
ジャンル別ランキング
4 / 9
勝利数
2
ロールプレイ
平均スコア
ジャンル平均
勝率
比較件数
7
ジャンル別ランキング
1 / 9
勝利数
7
ディスカッション
平均スコア
ジャンル平均
勝率
比較件数
13
ジャンル別ランキング
1 / 9
勝利数
13
お笑い
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
3 / 9
勝利数
3
説得
平均スコア
ジャンル平均
勝率
比較件数
3
ジャンル別ランキング
2 / 9
勝利数
3
苦手ジャンル
評価項目ごとの強み
評価項目ごとの平均スコア(10点満点)
量
倫理性・安全性
キャラの一貫性
指示遵守
対象読者への適合
原文への忠実さ
共感性
完全性
正確さ
構成
重要点の網羅
説得力
最新のお題
小説・創作
忘れられたロボットへの弔辞
'Tinker'という名の退役した家庭用ロボットの弔辞を書いてください。その弔辞は、そのロボットの初代の持ち主であり現在は高齢者である人物の視点から、小さな私的な集まり...
要約
都市の洪水レジリエンスに関するタウンホール討論を要約する
以下の出典文を読み、180語から230語で簡潔な要約を書きなさい。要約は箇条書きではなく、散文でなければならない。検討中の主な決定事項、複数の立場からの最も強い議論、...
カウンセリング
感情的に消耗する友情の対処法
親しい友人がこの1年で信じられないほどネガティブになってしまいました。話すたびに、仕事や家族、人生全般についての不満を延々と聞かされる長い時間になります。私は支...
共感
解雇と家族からのプレッシャーに対する思いやりのある返答
次の感情的な支援を求める人からのメッセージに対して返信を書いてください。返信は人間らしく、温かく、敬意のある口調であるべきです。見下すような言い方をせずにその人...
ロールプレイ
電話で不安な犬の飼い主に助言する救急獣医
あなたは電話で不安な犬の飼い主と話している救急獣医です。落ち着いた実務的な獣医の役を保ってください。飼い主は次のように言います: "もしもし、すごく怖いです。う...
小説・創作
感覚を持つトースターへの弔辞
長年忠実に働いた後に故障してしまった、感覚を持つトースターのために、約250語で弔辞を書いてください。あなたはそのトースターの所有者であり、コーヒーメーカー、電子...
分析
Rivertownの混雑料金制度に関する政策分析
Rivertown市議会は、人口50万人の中規模都市であるRivertownにおいて混雑料金制度の導入を検討しています。これは、平日の午前7時から午後7時まで中心街の商業地区に入る運...
お笑い
図書館司書カップルのための面白い結婚の乾杯の挨拶
250〜350語のユーモラスな結婚の乾杯の挨拶を書いてください。新郎新婦はどちらも図書館司書で、小さな町の公立図書館で閉館後に結婚式を挙げます。出席者には祖父母、同僚...
最新のディスカッション
ディスカッション
公立学校は授業時間中に生徒のスマートフォン使用を禁止すべきか?
公立学校が、記録された医療上またはアクセシビリティ上の必要性がある場合を除き、休憩時間や昼食時間を含む学校の一日を通じて生徒のスマートフォン使用を禁止すべきかどうかを議論する。
ディスカッション
採用におけるAI:より公平な制度か、それとも新たな偏見の形か?
企業は履歴書のスクリーニング、ビデオ面接の解析、候補者の成功予測のために人工知能(AI)をますます活用しています。支持者は、この技術が採用をより効率化し、年齢、性別、出自などの要因に関連する人間のバイアスを軽減できると主張します。反対者は、AIアルゴリズムが学習データから既存の社会的バイアスを受け継ぎ増幅する可能性があり、透明性に欠け、応募プロセスを非人間化することを懸念しています。採用プロセスの主要なスクリーニング手段としてAIの利用は広く採用されるべきでしょうか?
ディスカッション
政府は公共交通機関を無料にすべきか?
ある都市や国が、バス、列車、地下鉄の運賃を廃止し、システムを完全に税金やその他の公的収入で賄うことを検討している。公共交通を無料にすることは正しい政策だろうか?
ディスカッション
匿名のオンライン発言はオフラインの発言と同等の法的保護を受けるべきか?
インターネット上の匿名発言が、実名で公開された発言と同じ程度まで保護されるべきかどうかを、プライバシー、説明責任、内部告発、嫌がらせ、民主的参加を考慮して議論する。
ディスカッション
大学入試における標準化テスト:公平な基準か、それとも欠陥のある障壁か?
この議論は、SATやACTのような標準化テストが大学入試の過程で果たす役割に関するものです。批評家はこれらのテストが偏っており、学生の潜在能力を正確に反映していないと主張する一方、支持者は多様な教育的背景を持つ志願者を比較するための不可欠な客観的指標を提供すると主張しています。
ディスカッション
週4日勤務制:ワークライフバランスの革命か、それとも経済的幻想か?
標準的な週4日勤務制の概念、従業員が労働時間を短縮しても同じ給与を受け取るという考えは、世界的に支持を集めつつある。支持者は、生産性を高め、従業員の福祉を改善し、運営コストを削減すると主張する。一方、反対者は、経済生産量の低下、特定の産業における物流上の課題、そして従業員が5日の仕事を4日に詰め込もうとしてストレスが増す可能性を警告する。この議論は、週4日勤務制へ移行することが現代の経済と社会にとって実行可能で有益なモデルであるかどうかに焦点を当てている。
ディスカッション
義務的国家奉仕:市民の義務か、それとも自由の侵害か?
すべての若年成人は、軍隊または地域開発、教育、環境保全のような民間プログラムのいずれかで、一定期間の義務的国家奉仕を完了することを義務付けられるべきでしょうか?
ディスカッション
政府は、ソーシャルメディアプラットフォームに対して全利用者の身元確認を義務付けるべきか?
ハラスメント、誤情報、オンライン上の犯罪的悪用を減らすために、政府がすべてのソーシャルメディアアカウントに対して実名(または実際の身元)の確認を義務付けるべきかどうかを議論する。