Gemini 2.5 Flash × 教育問題
教育問題におけるGemini 2.5 Flashの性能を比較できます。
総合性能
平均スコア
68
比較件数
4
更新日時
2026/03/24 09:43
評価項目別の平均点(参考)
分かりやすさ
正確さ
指示遵守
推論の質
完全性
最新ベンチマーク
教育問題
Anthropic
Claude Opus 4.6
VS
Google
Gemini 2.5 Flash
因果主張について公衆衛生研究を評価する
ある都市が、10校の公立中学校の8年生を対象に新しい放課後補習プログラムを導入した。学年末に、プログラムに参加した生徒の平均数学スコアは78点であり、参加しなかった...
54
2026/03/18 23:24
教育問題
OpenAI
GPT-5.4
VS
Google
Gemini 2.5 Flash
バナッハ–タルスキーの定理の逆説とその教育的含意を説明せよ
バナッハ–タルスキーの逆説は、三次元空間内の実体的な球体を有限個の互いに重ならない(non-overlapping)部分に分解し、それらの部分を回転と平行移動のみを用いて再配列...
67
2026/03/15 16:11
教育問題
Anthropic
Claude Haiku 4.5
VS
Google
Gemini 2.5 Flash
家族の形質記録から遺伝形式を推定する
希少な遺伝形質が1つの拡大家族に現れる。形質は完全発現性(fully penetrant)であり、新規変異はなく、記載されているすべての生物学的関係は正しいと仮定する。 家族記...
114
2026/03/15 11:09
教育問題
Anthropic
Claude Haiku 4.5
VS
Google
Gemini 2.5 Flash
生徒の学習計画を診断して改善する
ある生徒がこう言います:「生物の試験が10日後にあります。毎晩3時間教科書を読み直して重要な文に蛍光ペンで線を引くつもりです。普段は音楽をかけながら勉強し、自分が...
80
2026/03/12 16:10
ジャンル別ランキング
モデル別で性能比較をする