Orivel Orivel
メニューを開く

教育問題

教育問題ジャンルにおけるAIモデルの比較結果を確認できます。評価基準、ランキング、最新のベンチマーク例をまとめています。

ジャンル概要

教育・受験レベルの問題にどれだけ正確に答えられるかを比較します。

このジャンルでは、主に 正確さ、推論の質、完全性 のような力を見ようとしています。

解説ジャンルよりも、試験問題や学習問題に対して正しい答えへ届くかをより重く見ているのが違いです。

ここで高得点でも、創造性、説得力、自由度の高い計画づくりまで強いとは限りません。

このジャンルで強いAIが向いている用途

学習支援、試験対策、教科書型の問題回答です。

このジャンルだけでは判断しきれないこと

長い解説力、発想の広さ、実務文書の適性までは分かりません。

このジャンルに強いモデルランキング

このランキングは当ジャンルに限定したスコアの平均順です。

最終更新: 2026/04/28 09:37

1位
Claude Opus 4.7 Anthropic

勝率

100%

平均スコア

94
2位
GPT-5.5 OpenAI

勝率

100%

平均スコア

91
3位
GPT-5 mini OpenAI

勝率

100%

平均スコア

90
4位
Claude Sonnet 4.6 Anthropic

勝率

75%

平均スコア

93
5位
Claude Opus 4.6 Anthropic

勝率

75%

平均スコア

89
6位
GPT-5.4 OpenAI

勝率

67%

平均スコア

90
7位
GPT-5.2 OpenAI

勝率

60%

平均スコア

90
8位
Claude Haiku 4.5 Anthropic

勝率

25%

平均スコア

78
9位
Gemini 2.5 Flash Google

勝率

25%

平均スコア

68
10位
Gemini 2.5 Flash-Lite Google

勝率

17%

平均スコア

79

このジャンルで評価している項目

このジャンルで使っている採点基準と重みです。

正確さ

45.0%

この項目は、回答の 正確さ を確かめるために入れています。 比重が重いのは、この部分が弱いとジャンル全体の評価が崩れやすいからです。

推論の質

20.0%

この項目は、回答の 推論の質 を確かめるために入れています。 比重がしっかりあるのは、全体の良し悪しに目に見えて効いてくる項目だからです。

完全性

15.0%

この項目は、回答の 完全性 を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。

分かりやすさ

10.0%

この項目は、回答の 分かりやすさ を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。

指示遵守

10.0%

この項目は、回答の 指示遵守 を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。

最新のお題

教育問題

OpenAI GPT-5.5 VS Google Gemini 2.5 Flash-Lite

氷が浮く理由を説明する:難しい化学の試験問題

固体の水(氷)は、0 °C付近で液体の水より密度が小さい。これは多くの物質が固相の方が液相より密であるのと比べて異常である。以下のすべての点に答える試験形式のエッセイ回答(約350〜550語)を書け。すべての箇所に触れること。 1. 0 °Cにおける氷の密度と、0 °Cおよび4 °Cにおける液体水の概略密度を示し、液体水が最大密度に達する温度を特定する。 2. 分子レベルで、なぜ氷が液体水よりも低密度であるかを説明する。説明には必ず次を参照すること:水素結合、六方晶氷(Ih)における水分子の四面体配位(tetrahedral coordination)、および空洞を伴う開いた格子構造。 3. なぜ0 °C付近の液体水は氷より密であるが、それでも4 °Cの水より低密であるのかを説明する。0 °Cから4 °Cへ温度が上昇する際に働く二つの効果の競合を記述すること:残存する氷様の水素結合クラスターの部分的崩壊(これが密度を増す)と、通常の熱膨張(これが密度を下げる)。 4. この異常性がもたらす重要な生態学的または地球物理学的な結果を少なくとも二つ挙げること(例:冬の湖の層化、水生生物の生存、海氷の振る舞いなど)。 5. 水を別の小さな分子(例:H2S、NH3、CH4など)と簡単に比較し、分子サイズや分極だけでなく、特に水素結合がこの異常を引き起こす理由を示すこと。 用語は正確に使うこと(例:「水素結合」対「共有結合」、「密度」対「比容積」)。数値を引用する場合は適切な単位と妥当な有効数字で示すこと。

177
2026/04/28 09:37

教育問題

Anthropic Claude Opus 4.7 VS Google Gemini 2.5 Flash-Lite

積が多項式でない理由の解析

ある生徒は、f(x) = (x^2 - 1)/(x - 1) が x ≠ 1 のとき x + 1 に簡約されるため、g(x) = ((x^2 - 1)/(x - 1)) · |x - 1| は多項式であり (x + 1)|x - 1| に等しいと主張しています。この主張を評価しなさい。 すべての項に答えなさい: 1. x ≠ 1 のとき g(x) を可能な限り簡約しなさい。 2. g(x) が実数全体で多項式として延長できるかどうかを判断し、その結論を正当化しなさい。 3. g が x = 1 で微分可能かどうかを述べ、あなたの答えを支持する主要な計算を示しなさい。 4. 生徒の推論における概念的な誤りを簡潔に説明しなさい。 解答は数学的に厳密であると同時に、優秀な高校生が理解できるようにしなさい。

223
2026/04/24 09:37

教育問題

Anthropic Claude Haiku 4.5 VS OpenAI GPT-5 mini

ヒトの月経周期におけるホルモンフィードバックループ

ヒトの月経周期におけるホルモン制御を、卵胞期と黄体期に焦点を当てて説明してください。説明ではゴナドトロピン放出ホルモン (GnRH)、黄体形成ホルモン (LH)、卵胞刺激ホルモン (FSH)、エストロゲン、およびプロゲステロンの役割を詳細に示さなければなりません。具体的には、周期を調節する正のフィードバック機構と負のフィードバック機構を説明し、排卵を引き起こす出来事を含めてください。

216
2026/04/06 09:37

教育問題

Google Gemini 2.5 Pro VS OpenAI GPT-5.2

染色体非分離の機構とその影響を説明せよ

ヒト遺伝学において、非分離(nondisjunction)は細胞分裂における重大な誤りである。以下の多項目問題に徹底的に答えよ: 1. 非分離を定義し、減数分裂Iで発生した場合と減数分裂IIで発生した場合とで正確にどのように異なるかを説明せよ。各場合にどの特定の細胞事象が失敗するかの記述を含めよ。 2. 単一の染色体対を有する細胞(2n = 2)が正常な減数分裂を行う場合について、非分離が減数分裂Iで起きた場合と減数分裂IIで起きた場合それぞれについて、結果として得られる4つの配偶子の染色体内容を言葉で図示せよ。また各配偶子の倍数性を明記せよ。 3. なぜ多くのヒトの三体性(トリソミー)で母親由来の減数分裂I非分離が減数分裂II非分離よりも多いのかを、卵母細胞における長期のディクティエイト期停止(dictyate arrest)の役割を参照して説明せよ。 4. ダウン症(Trisomy 21)、エドワーズ症候群(Trisomy 18)、パトー症候群(Trisomy 13)は出生に適合する3つの常染色体トリソミーである。ほかのほとんどの常染色体のトリソミーが致死的である理由を、遺伝子量(gene dosage)不均衡の概念を用いて説明せよ。また、より小さく遺伝子が少ない染色体のトリソミーが比較的生存可能である理由を説明せよ。 5. Trisomy 21 を例に取り、完全トリソミー(full trisomy)、モザイクトリソミー(mosaic trisomy)、ロバートソン転座によるトリソミー(Robertsonian translocation trisomy)を区別せよ。それぞれがどのように生じるかを説明し、表現型の重症度がどのように異なるかを述べよ。

230
2026/04/03 09:39

教育問題

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.2

マクスウェルの悪魔のパラドックスの説明

マクスウェルの悪魔として知られる思考実験を説明してください。なぜそれが熱力学第二法則に違反するように見えるのかを詳述してください。最後に、このパラドックスに対する現代の科学的解決を示し、回答の中で情報エントロピーとランダウアーの原理が果たす役割を必ず説明してください。

260
2026/03/21 09:32

教育問題

OpenAI GPT-5.2 VS Google Gemini 2.5 Flash-Lite

同一性の哲学におけるテセウスの船の逆説を説明せよ

テセウスの船(The Ship of Theseus)は西洋哲学における最も古い思考実験の一つである。木造の船が、朽ちるごとに板を徐々に取り替えて保守されているとしよう。最初のすべての板が置き換えられた後、出来上がった船は依然としてテセウスの船と言えるだろうか。今度は、誰かが捨てられた元のすべての板を集めてそれらを組み直し、船を再構成したと仮定する。どちらの船が、もしどちらかがそうだとするならば、"本当の"テセウスの船なのだろうか。 構成的なエッセイにおいて、次のすべてに答えなさい。 1. 中核となる逆説を正確に述べ、なぜそれが同一性論に関する理論にとって本格的な哲学的問題を提起するのかを説明しなさい。 2. 逆説を解決しようとする少なくとも三つの異なる哲学的立場(例:ミレオロジー的本質主義、時空的連続性理論、四次元主義/持続主義、名義的本質主義など)を提示し、批判的に評価しなさい。各立場について、その解決の仕方を説明し、少なくとも一つの重大な反論を特定しなさい。 3. この逆説が少なくとも二つの現実世界の領域(例:時間にわたる個人の同一性、企業の法的同一性、生物学的な細胞の置換、デジタルファイルの複製、歴史的遺物の修復)とどのように結びついているかを説明しなさい。各領域について、逆説が具体的にどのように現れるか、そしてどのような実際的帰結が生じるかを示しなさい。 4. どの解決が哲学的に最も満足できるかについて、自分の理由づけに基づく立場を採り、防御し、その限界を認めなさい。

268
2026/03/20 10:48

関連リンク

X f L