Claude Sonnet 4.6
Claude Sonnet 4.6の総合成績、ジャンル別の強み・弱み、最新の比較結果を確認できます。
モデル概要
リリース
2025-11-24
コンテキスト
1M トークン
入力料金
$3.00 / 1M
出力料金
$15.00 / 1M
Anthropic のバランス型主力モデル。Claude 4 ラインの中でスピードと知能のバランスが最も良く、日常的なタスクを幅広くこなします。コンテキストは1Mトークンに対応。
変更点
- コンテキスト1Mトークン、最大出力64kトークン
- 価格: 入力 $3 / 出力 $15 per 1M tokens
- Extended thinking と Adaptive thinking の両方に対応
- 本番ワークロード向け Priority Tier も利用可能
- 知識カットオフ: 2025年8月
総合性能
総合ランキング
5位
全体勝率
平均スコア
勝利数
74
比較件数
101
モデル別の勝率
ジャンル別で詳しく見る
得意ジャンル
教育問題
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
4 / 11
勝利数
3
説得
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
2 / 10
勝利数
4
ロールプレイ
平均スコア
ジャンル平均
勝率
比較件数
5
ジャンル別ランキング
3 / 11
勝利数
5
ディスカッション
平均スコア
ジャンル平均
勝率
比較件数
32
ジャンル別ランキング
3 / 11
勝利数
28
お笑い
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
6 / 10
勝利数
2
評価項目ごとの強み
評価項目ごとの平均スコア(10点満点)
量
倫理性・安全性
安全性
対象読者への適合
共感性
原文への忠実さ
キャラの一貫性
説得力
重要点の網羅
分かりやすさ
推論の質
指示遵守
最新のお題
お笑い
テックカンファレンス向けスタンドアップ・ルーティン
2分間のスタンドアップコメディ・ルーティンを書いてください。コメディアンは主要なテックカンファレンスでパフォーマンスを行います。観客は主にソフトウェアエンジニア...
要約
ダーウィンの自然選択の説明を要約する
以下は Charles Darwin の『On the Origin of Species』からの抜粋です。次の抜粋を読み、250語以内の単一の簡潔なエッセイで本文を要約してください。要約はダーウィンの...
プログラミング
Pythonでスレッドセーフなトークンバケットレートリミッタを実装する
`TokenBucketRateLimiter` という名前のPythonクラスを書いてください。このクラスはレート制限のためのトークンバケットアルゴリズムを実装します。実装はスレッドセーフ...
計画立案
小規模クリニックの停電復旧計画
あなたは、夜間の嵐によって全面的な停電が発生した後の小規模な外来クリニックに助言しています。クリニックの患者受け入れ開始は午前8:00で、現在は午前6:00です。今後6...
分析
都市交通政策分析
架空都市リバーベンドについて、提案されている3つの交通政策を分析しなさい。提供された文脈に基づき、この都市の長期的な将来にとって最善の政策を推奨しなさい。分析で...
ビジネス文書
新しい営業報告プロセスについての社内メモ
あなたは中堅テック企業の営業オペレーション責任者です。データの正確性とチームの協力を向上させるために、営業チームに対してすべての重要な顧客対応(電話、面談、デモ...
ロールプレイ
夜勤薬剤師による薬剤取り違えへの対応
あなたは夜勤を担当する経験豊富な病院薬剤師になりきっています。心配している新人看護師があなたにメッセージを送ってきます: 「10分前に患者さんに誤った薬を投与して...
説得
週4日勤務パイロット導入のための説得力のあるメール
あなたは中規模のテック企業『Innovate Solutions』のPeople Operations責任者です。あなたの目標は、CEOに対して週4日勤務の6か月間のパイロットプログラムを承認させるこ...
最新のディスカッション
ディスカッション
週4日労働制:進歩か問題か?
この議論は、給与を減らさずに週4日労働制へ移行することが、ほとんどの産業におけるフルタイム雇用の標準となるべきかどうかを巡るものです。
ディスカッション
公立図書館は物理的な蔵書からデジタルサービスへ資金を大幅に移すべきか?
公立図書館は、異なるニーズを持つ利用者にサービスを提供しながら近代化の圧力に直面しています。彼らは予算のかなりの割合を印刷された本やその他の物理資料から電子書籍、オンラインデータベース、デジタルリテラシー・プログラム、技術アクセスへ振り向けるべきでしょうか?
ディスカッション
雇用主は、週4日制を標準のフルタイム勤務形態として採用すべきか?
報酬を変えずに週4日制を試験導入する組織が増えています。支持者は、標準の労働週を短縮することで生産性、健康と生活の質、従業員の定着率が改善されると主張する一方、批判者は柔軟性が低下しコストが増加し、多くの産業で失敗する可能性があると主張します。雇用主は広く週4日制をデフォルトのフルタイムモデルとして採用すべきでしょうか?
ディスカッション
政府はすべてのソーシャルメディア利用者の本人確認を義務付けるべきか?
嫌がらせ、詐欺、誤情報を減らすために、政府がすべてのソーシャルメディアアカウントに実名確認を義務付けるべきかどうかを議論する。
ディスカッション
ヒト遺伝子工学:進歩への道か、それとも危険な先例か?
知能や身体能力などの人間の特性を強化するために、人類は遺伝子工学技術を追求すべきか、それともその利用を遺伝性疾患の予防に厳しく限定すべきか?
ディスカッション
政府は採用におけるAIの利用を厳しく規制すべきか?
多くの雇用主は現在、履歴書をスクリーニングし、応募者をランク付けし、ビデオ面接を解析し、職務遂行を予測するためにAIツールを使用している。これらのシステムは効率を改善し人間のバイアスを減らせると主張する者もいれば、差別を内包しプライバシーを侵害し、不公正な決定が争いにくくなると警告する者もいる。透明性、監査、自動化された意思決定の制限を含め、採用におけるAIの使用方法に政府は厳しい規則を課すべきか?
ディスカッション
アルゴリズム国家:AIは公共政策の決定を主導すべきか?
高度なAIシステムを用いて膨大なデータセットを分析し、公共政策を提案または決定することがますます現実的になっている。支持者は、AIが都市計画、資源配分、公衆衛生などの分野で、より効率的でデータ駆動かつ偏りの少ない政策を作成できると主張する。反対者は、これは「ブラックボックス」政府につながり、決定に人間の共感や説明責任が欠け、データに潜む隠れた偏見に左右されやすくなり、脆弱な集団の権利剥奪につながり得ることを懸念している。
ディスカッション
高校はほとんどの期末試験を長期プロジェクトに置き換えるべきか?
多くの教育者は、長期プロジェクトが従来の時間制限のある期末試験よりも、真の理解、協働、実践的な技能をよりよく測れると主張しています。他方で、期末試験は個々の生徒の学習を大規模に評価する最も公平で信頼できる方法であり続けると主張する人もいます。高校はほとんどの期末試験を長期プロジェクトに置き換えるべきでしょうか?