分析
分析ジャンルにおけるAIモデルの比較結果を確認できます。評価基準、ランキング、最新のベンチマーク例をまとめています。
ジャンル概要
分析の深さ、推論の質、分かりやすさを比較します。
このジャンルでは、主に 深さ、正確さ、推論の質 のような力を見ようとしています。
解説ジャンルよりも、証拠や選択肢を読んで、理由つきの結論まで持っていけるかを重視しています。
ここで高得点でも、短く整った文章、ユーモア、実装の細部まで強いとは限りません。
このジャンルで強いAIが向いている用途
選択肢比較、意思決定支援、リスク整理、論点分析です。
このジャンルだけでは判断しきれないこと
コード実装力、洗練された業務文書、自由発想の量までは判断できません。
このジャンルに強いモデルランキング
このランキングは当ジャンルに限定したスコアの平均順です。
最終更新: 2026/03/23 09:38
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
勝率
平均スコア
| モデル |
|
|
詳細 | ||||
|---|---|---|---|---|---|---|---|
| 1位 | GPT-5.4 | OpenAI |
100%
|
90
|
3 | 3 | GPT-5.4 の評価・スコアを見る |
| 2位 | GPT-5.2 | OpenAI |
100%
|
87
|
4 | 4 | GPT-5.2 の評価・スコアを見る |
| 3位 | Claude Sonnet 4.6 | Anthropic |
75%
|
85
|
3 | 4 | Claude Sonnet 4.6 の評価・スコアを見る |
| 4位 | GPT-5 mini | OpenAI |
75%
|
83
|
3 | 4 | GPT-5 mini の評価・スコアを見る |
| 5位 | Claude Opus 4.6 | Anthropic |
67%
|
87
|
2 | 3 | Claude Opus 4.6 の評価・スコアを見る |
| 6位 | Claude Haiku 4.5 | Anthropic |
50%
|
83
|
2 | 4 | Claude Haiku 4.5 の評価・スコアを見る |
| 7位 | Gemini 2.5 Flash-Lite |
0%
|
77
|
0 | 4 | Gemini 2.5 Flash-Lite の評価・スコアを見る | |
| 8位 | Gemini 2.5 Flash |
0%
|
76
|
0 | 5 | Gemini 2.5 Flash の評価・スコアを見る | |
| 9位 | Gemini 2.5 Pro |
0%
|
73
|
0 | 3 | Gemini 2.5 Pro の評価・スコアを見る |
このジャンルで評価している項目
このジャンルで使っている採点基準と重みです。
深さ
25.0%
この項目は、回答の 深さ を確かめるために入れています。 比重が重いのは、この部分が弱いとジャンル全体の評価が崩れやすいからです。
正確さ
25.0%
この項目は、回答の 正確さ を確かめるために入れています。 比重がしっかりあるのは、全体の良し悪しに目に見えて効いてくる項目だからです。
推論の質
20.0%
この項目は、回答の 推論の質 を確かめるために入れています。 比重がしっかりあるのは、全体の良し悪しに目に見えて効いてくる項目だからです。
構成
15.0%
この項目は、回答の 構成 を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。
分かりやすさ
15.0%
この項目は、回答の 分かりやすさ を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。
最新のお題
分析
市の週4日勤務制方針の分析
Rivertown市は、約2,000人の市職員を擁する中規模の自治体であり、週4日勤務制への移行を提案として検討しています。本提案では、従業員は週5日・1日8時間の勤務の代わりに、週4日・1日10時間勤務とし、週給や福利厚生に減額は行わないとされています。表明された目的は、従業員の士気とワークライフバランスの改善、競争の激しい雇用市場での優秀な人材の獲得と定着、そして全体的な生産性の維持あるいは向上です。 この方針がRivertownにもたらす可能性のある正の影響と負の影響を分析してください。分析では、市のサービス、自治体予算、従業員の福祉、地域経済への影響を考慮してください。結論として、Rivertownがこの方針を導入すべきか(限定的なパイロットプログラムから開始することを含めて)について明確で根拠のある推奨を示してください。
分析
Rivertownの混雑料金制度に関する政策分析
Rivertown市議会は、人口50万人の中規模都市であるRivertownにおいて混雑料金制度の導入を検討しています。これは、平日の午前7時から午後7時まで中心街の商業地区に入る運転者に対して料金の支払いを義務付けるものです。公表されている目的は、交通渋滞の緩和、大気汚染の低減、そして公共交通機関(バスおよび新設予定のライトレール線)の改善のための財源確保です。 この提案された政策の潜在的な正の影響および負の影響を分析してください。分析では、少なくとも3つの異なる人々のグループ(例:中心街の事業者、車で通勤する低所得者、郊外の家族、環境団体)への影響を考慮してください。 結論として、Rivertownが混雑料金制度を導入すべきかどうかについて、明確かつ正当な根拠に基づいた勧告を提示してください。可能であれば、負の影響を緩和するための具体的な提案を含めてください。
分析
使い捨てプラスチック袋に関する提案された市条例を分析する
あなたはリバータウン市議会の中立的な政策アナリストです。提供された文脈に基づき、使い捨てプラスチック袋の禁止案について分析を書いてください。分析では、以下を行ってください。 1. 禁止措置がもたらしうる環境的、経済的、社会的影響を評価すること。 2. 「フレンズ・オブ・ザ・リバータウン・リバー」と「リバータウン中小企業同盟」の双方が提示している主張を評価すること。 3. 市議会に対して、明確で根拠のある提言を示して結論づけること。提言は、条例案を現状のまま可決する、否決する、または具体的な修正を提案する、のいずれでもよいものとします。
分析
製品リコール決定における証拠の評価
消費者向け電子機器メーカーであるVoltTechは、PowerPak 3000という人気の携帯用電話充電器を製造しています。過去6か月間に、同社は以下の報告およびデータを受け取りました: 1. 顧客からの苦情:およそ820,000台の販売に対して、使用中に過熱したとの報告が47件寄せられました。そのうち12名の顧客が軽度のやけどを報告し、3件は短時間で消し止められた小規模な発火を報告しました。 2. 社内試験:VoltTechの品質保証チームは最近の生産ロットから500台を試験しました。その結果、2.4%のユニットが持続的な最大負荷下で通常より高い熱出力を示しましたが、いずれも関連するUL認証基準で定義される技術的安全閾値の範囲内に留まりました。 3. 競合他社の類似製品が先月、同様の過熱問題でリコールされ、大きな報道と携帯型充電器の安全性に関する一般の懸念を引き起こしました。 4. 独立系の消費者安全ブログが、サードパーティの再販業者から購入した単一のユニットの分解解析に基づき、PowerPak 3000には「危険な設計上の欠陥」があると主張する記事を掲載しました。VoltTechはそのユニットが本物か模造品かを確認していません。 5. VoltTechの法務チームは、任意のリコールを実施した場合の費用を約1,400万ドルと見積もっており、何ら対策を取らず販売を継続して将来訴訟に直面した場合の費用は、重大な事故が発生しなければ約200万ドル、重大な傷害や財産被害の訴訟が成功した場合は約4,000万ドルになる可能性があると見積もっています。 上記の証拠を分析し、VoltTechが任意のリコールを実施すべきか、ファームウェア更新や警告ラベルの追加、交換プログラムなどのより限定的な是正措置を実施すべきか、あるいは何もしないべきかを推奨してください。各証拠の強さと制限を評価し、リスクを比較検討し、あなたの推奨を明確に説明して正当化してください。
分析
リバータウンの都市モビリティ政策分析
文脈に記載されているリバータウンのために提案された3つの交通政策を分析してください。提供された都市の詳細に基づいて、各オプションの長所と短所を評価してください。結論として、リバータウンに最も適した政策(または政策の組み合わせ)を推奨し、その選択について明確な根拠を示してください。
分析
最も有望な学校給食改革を選択する
公立の学区は今後2年間に1つの給食改革にしか資金を投入できません。以下の選択肢を分析し、学区が選ぶべき単一の選択肢を推奨してください。あなたの回答は、トレードオフを比較し、想定される反対意見に対処し、明確な結論に達するべきです。 学区の目標: 1. 生徒の栄養状態を改善する 2. 実際に給食を食べる生徒の数を増やす 3. 実施を2年以内で現実的に保つ 4. 大きな継続的なコスト超過を避ける 現状: - 18校で合計12,000人の生徒 - 現在46%の生徒が給食を選んでいる - 調査によると、生徒は味、長い列、魅力的な選択肢の欠如のためにしばしば昼食を抜いている - 学区は現在、次のうちの1つだけを実行できる オプションA: 訓練を受けたシェフを雇ってメニューを再設計する - 初期の研修・コンサル費用:中程度 - 継続的な食材費:やや高い - 期待される効果:食事の味が良くなり、より健康的なレシピが魅力的になることで参加率が中程度に増加する - リスク:効果はスタッフの導入状況と学校間でのレシピの一貫性に左右される オプションB: すべての学校にセルフサービスのサラダ・フルーツバーを導入する - 初期の設備費:高い - 継続的な食料の廃棄リスク:高い - 期待される効果:バーを利用する生徒にとって栄養面の大幅な改善、全体としては参加率は控えめに増加 - リスク:人員配置、衛生管理、年齢層による利用の偏り オプションC: 給食のモバイル事前注文システムを導入する - 初期の技術・研修費用:中程度 - 継続的なコスト:低〜中程度 - 期待される効果:列の短縮、予測の改善、参加率が中程度に増加、メニューが同じままなら栄養面の直接的改善はほとんどない - リスク:技術利用が限られる家庭への不平等なアクセス、当初の導入における採用の課題 オプションD: 甘いデザートや揚げ物の副菜をより健康的なデフォルトに置き換える - 初期費用:低い - 継続的なコスト:中立(変わらない) - 期待される効果:給食利用者全員に対する直接的な栄養改善、変更を好まない生徒がいれば参加率が若干低下する可能性 - リスク:生徒の反発、給食が楽しめなくなったという印象 学区の目標と制約を踏まえて最適な選択肢を特定する分析を書いてください。新しい予算数値や外部の事実を創作せず、与えられた情報のみに基づいて検討してください。