Orivel Orivel
メニューを開く

教育問題

教育問題ジャンルにおけるAIモデルの比較結果を確認できます。評価基準、ランキング、最新のベンチマーク例をまとめています。

ジャンル概要

教育・受験レベルの問題にどれだけ正確に答えられるかを比較します。

このジャンルでは、主に 正確さ、推論の質、完全性 のような力を見ようとしています。

解説ジャンルよりも、試験問題や学習問題に対して正しい答えへ届くかをより重く見ているのが違いです。

ここで高得点でも、創造性、説得力、自由度の高い計画づくりまで強いとは限りません。

このジャンルで強いAIが向いている用途

学習支援、試験対策、教科書型の問題回答です。

このジャンルだけでは判断しきれないこと

長い解説力、発想の広さ、実務文書の適性までは分かりません。

このジャンルに強いモデルランキング

このランキングは当ジャンルに限定したスコアの平均順です。

最終更新: 2026/03/21 09:32

1位
GPT-5 mini OpenAI

勝率

100%

平均スコア

91
2位
Claude Sonnet 4.6 Anthropic

勝率

75%

平均スコア

93
3位
Claude Opus 4.6 Anthropic

勝率

75%

平均スコア

89
4位
GPT-5.4 OpenAI

勝率

67%

平均スコア

90
5位
GPT-5.2 OpenAI

勝率

50%

平均スコア

89
6位
Claude Haiku 4.5 Anthropic

勝率

33%

平均スコア

77
7位
Gemini 2.5 Flash-Lite Google

勝率

25%

平均スコア

77
8位
Gemini 2.5 Flash Google

勝率

25%

平均スコア

68
9位
Gemini 2.5 Pro Google

勝率

0%

平均スコア

85

このジャンルで評価している項目

このジャンルで使っている採点基準と重みです。

正確さ

45.0%

この項目は、回答の 正確さ を確かめるために入れています。 比重が重いのは、この部分が弱いとジャンル全体の評価が崩れやすいからです。

推論の質

20.0%

この項目は、回答の 推論の質 を確かめるために入れています。 比重がしっかりあるのは、全体の良し悪しに目に見えて効いてくる項目だからです。

完全性

15.0%

この項目は、回答の 完全性 を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。

分かりやすさ

10.0%

この項目は、回答の 分かりやすさ を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。

指示遵守

10.0%

この項目は、回答の 指示遵守 を確かめるために入れています。 比重をやや軽くしているのは、重要ではあるものの、このジャンルの中心そのものではないからです。

最新のお題

教育問題

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.2

マクスウェルの悪魔のパラドックスの説明

マクスウェルの悪魔として知られる思考実験を説明してください。なぜそれが熱力学第二法則に違反するように見えるのかを詳述してください。最後に、このパラドックスに対する現代の科学的解決を示し、回答の中で情報エントロピーとランダウアーの原理が果たす役割を必ず説明してください。

45
2026/03/21 09:32

教育問題

OpenAI GPT-5.2 VS Google Gemini 2.5 Flash-Lite

同一性の哲学におけるテセウスの船の逆説を説明せよ

テセウスの船(The Ship of Theseus)は西洋哲学における最も古い思考実験の一つである。木造の船が、朽ちるごとに板を徐々に取り替えて保守されているとしよう。最初のすべての板が置き換えられた後、出来上がった船は依然としてテセウスの船と言えるだろうか。今度は、誰かが捨てられた元のすべての板を集めてそれらを組み直し、船を再構成したと仮定する。どちらの船が、もしどちらかがそうだとするならば、"本当の"テセウスの船なのだろうか。 構成的なエッセイにおいて、次のすべてに答えなさい。 1. 中核となる逆説を正確に述べ、なぜそれが同一性論に関する理論にとって本格的な哲学的問題を提起するのかを説明しなさい。 2. 逆説を解決しようとする少なくとも三つの異なる哲学的立場(例:ミレオロジー的本質主義、時空的連続性理論、四次元主義/持続主義、名義的本質主義など)を提示し、批判的に評価しなさい。各立場について、その解決の仕方を説明し、少なくとも一つの重大な反論を特定しなさい。 3. この逆説が少なくとも二つの現実世界の領域(例:時間にわたる個人の同一性、企業の法的同一性、生物学的な細胞の置換、デジタルファイルの複製、歴史的遺物の修復)とどのように結びついているかを説明しなさい。各領域について、逆説が具体的にどのように現れるか、そしてどのような実際的帰結が生じるかを示しなさい。 4. どの解決が哲学的に最も満足できるかについて、自分の理由づけに基づく立場を採り、防御し、その限界を認めなさい。

48
2026/03/20 10:48

教育問題

Google Gemini 2.5 Pro VS OpenAI GPT-5 mini

熱力学第二法則と生物進化の逆説を説明せよ

生物の進化に対してよく挙げられる反論の一つは、それが孤立系の全エントロピーが時間とともに増大することを述べる熱力学第二法則に違反しているように見える、というものです。これに対して、進化はより単純なものからますます複雑で秩序だった生物を生み出すように見えます。 以下の点について構造化されたエッセイで取り組みなさい: 1. 孤立系と開放系の重要な区別を含め、熱力学第二法則を正確に述べよ。 2. 熱力学第二法則と生物進化の間に見かけ上の矛盾があるからといって真の逆説ではない理由を説明せよ。あなたの説明は、太陽からのエネルギー入力の役割と、局所的なエントロピー減少がより大きな全体的エントロピー増加と結びついているという概念に言及しなければならない。 3. 局所的な秩序が増大する一方で宇宙全体のエントロピーが増大する具体的な物理的または生物学的な例を、太陽-地球系自体以外で少なくとも二つ示せ。 4. 散逸構造(Ilya Prigogine によって導入された概念)について論じ、それが生物学的複雑性の出現とどのように関係するかを説明せよ。 5. なぜこの誤解が公の議論で持続するのかを簡潔に論じ、教育者がそれを効果的に訂正するためにできることを示せ。

56
2026/03/20 10:26

教育問題

OpenAI GPT-5 mini VS Google Gemini 2.5 Flash-Lite

アイデンティティ論におけるテセウスの船の逆説を説明せよ

テセウスの船は、西洋哲学における最も古い思考実験の一つである。ある木造の船があり、腐朽した板を順次取り替えることで維持されるとする。元の各板がすべて取り替えられた後、その結果としての船は依然としてテセウスの船と言えるだろうか。さらに、誰かが廃棄されたすべての元の板を回収し、それらを組み直して別の船を作ったとする。どちらの船が、もしどちらか一方ならば、「本当の」テセウスの船なのだろうか、あるいはどちらも本物ではないのだろうか。 構成の整ったエッセイにおいて、以下のすべてに答えよ: 1. 核心的な逆説を正確に述べ、なぜそれが同一性理論にとって真正の哲学的問題を提起するのかを説明する。 2. その逆説を解決しようとする、少なくとも三つの本質的に異なる哲学的立場を提示し、批判的に評価する(例:メレオロジー的本質主義、時空的連続性理論、四次元主義/perdurantism、名辞的本質主義など)。各立場について、その逆説に対する解決の仕方を説明し、少なくとも一つの重大な反論を指摘する。 3. この逆説が少なくとも二つの現実世界の領域(例:時間を通じた個人のアイデンティティ、企業の法的同一性、細胞の生体置換、デジタルファイルのコピー、史料や美術品の修復)とどのように結びつくかを説明する。各領域について、逆説が具体的にどのように現れるか、そしてどのような実際的影響が生じるかを示す。 4. どの解決が最も哲学的に満足できるかについて、自分の理性的な立場を取り、防御せよ。自らの立場の限界も認めること。

53
2026/03/19 14:34

教育問題

OpenAI GPT-5.2 VS Anthropic Claude Opus 4.6

量子もつれとベルの定理の説明

あなたは上級学部生向けの講義のために詳細な説明を準備している物理学の教授です。あなたの課題は量子もつれの概念を説明することです。あなたの説明は以下の三つの主要な領域を含めるべきです: 1. 量子もつれの明確な定義と、距離に関係なく二つの粒子が「結びついている」ことが何を意味するか。 2. ベルの定理の説明と、それがどのように実験的に量子力学を古典的な「局所的隠れ変数」理論と区別するか。 3. 量子計算、量子暗号、量子テレポーテーションなど、量子もつれの実世界での一つの潜在的応用の説明。

92
2026/03/19 12:25

教育問題

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Flash

因果主張について公衆衛生研究を評価する

ある都市が、10校の公立中学校の8年生を対象に新しい放課後補習プログラムを導入した。学年末に、プログラムに参加した生徒の平均数学スコアは78点であり、参加しなかった生徒の平均数学スコアは71点であった。 新聞の見出しは次のように述べている: 「補習プログラムは数学の点数を7ポイント上昇させた」。 以下のすべてを行う試験形式の解答を書きなさい: 1. 与えられた情報からその見出しの因果的主張が正当化されるかどうかを述べる。 2. 観察された7ポイントの差がプログラムの真の因果効果と等しくない可能性がある理由を、少なくとも3つの異なる観点から説明する。 3. より強い因果的結論を可能にする改善された研究デザインを1つ述べ、そのデザインがなぜ優れているかを説明する。 4. 改善されたデザインでもなお残りうる制限を1つ挙げる。 解答は明確で論理的に構成され、研究方法や統計の適切な概念を用いること。

54
2026/03/18 23:24

関連リンク

X f L