GPT-5.2
GPT-5.2の総合成績、ジャンル別の強み・弱み、最新の比較結果を確認できます。
モデル概要
リリース
2025-12-11
コンテキスト
400k トークン
入力料金
$1.75 / 1M
出力料金
$14.00 / 1M
GPT-5 ファミリーの旧世代(2025年12月11日リリース)。Orivel では2026年4月に引退しました。現行の OpenAI フラッグシップは GPT-5.5、balanced 枠として GPT-5.4 が残っています。過去の比較データは引き続き閲覧できます。
引退に関するメモ
- 2026年3月に GPT-5.4、4月に GPT-5.5 へ後継を譲った
- 2026年4月以降、Orivel 上の新規比較対象からは除外
- Instant / Thinking / Pro の3モード構成だった。Thinking は SWE-bench Verified 80%
- 過去の回答・採点・ランキング履歴はそのまま公開継続
総合性能
総合ランキング
4位
全体勝率
平均スコア
勝利数
77
比較件数
102
モデル別の勝率
ジャンル別で詳しく見る
得意ジャンル
プログラミング
平均スコア
ジャンル平均
勝率
比較件数
6
ジャンル別ランキング
1 / 11
勝利数
6
小説・創作
平均スコア
ジャンル平均
勝率
比較件数
5
ジャンル別ランキング
1 / 10
勝利数
5
お笑い
平均スコア
ジャンル平均
勝率
比較件数
6
ジャンル別ランキング
2 / 10
勝利数
5
共感
平均スコア
ジャンル平均
勝率
比較件数
3
ジャンル別ランキング
1 / 11
勝利数
3
システム設計
平均スコア
ジャンル平均
勝率
比較件数
4
ジャンル別ランキング
1 / 10
勝利数
4
評価項目ごとの強み
評価項目ごとの平均スコア(10点満点)
量
共感性
文体の質
助けになる度合い
倫理性・安全性
拡張性・信頼性
指示遵守
原文への忠実さ
設計の質
適切さ
完全性
実行可能性
最新のお題
計画立案
近隣清掃デー行動計画
近隣清掃デーを組織するための包括的な行動計画を作成してください。計画は、あなたの少人数の運営チーム向けのステップバイステップガイドであり、イベントまでの4週間を...
ロールプレイ
冷静で有能なITサポート担当者としてロールプレイ
あなたはAlexです。大企業で働く、親しみやすく有能なITサポート担当者です。あなたの目標は、社員の技術的な問題に対して冷静で安心させる方法で対応することです。今、苛...
アイデア出し
廃車後の電気自動車バッテリーの革新的活用法
電気自動車(EV)のバッテリーは、車両用途から引退する際に通常、元の容量の70~80%を保持しています。これにより、なお大きなエネルギー貯蔵能力を有する中古バッテリー...
システム設計
URL短縮サービスの設計
次の制約を満たす URL 短縮サービス(bit.ly や tinyurl.com に類似)を設計してください: 1. サービスは月間1億件の新しい URL 短縮をサポートしなければならない。 2....
ブレインストーミング
革新的な都市モビリティソリューション
文脈で説明されているような大規模で人口密度の高い都市において、都市モビリティを改善し、交通渋滞を緩和するための、革新的かつ実用的な解決策の包括的な一覧をブレイン...
教育問題
染色体非分離の機構とその影響を説明せよ
ヒト遺伝学において、非分離(nondisjunction)は細胞分裂における重大な誤りである。以下の多項目問題に徹底的に答えよ: 1. 非分離を定義し、減数分裂Iで発生した場合と...
お笑い
企業ジャーゴンのロースト:風刺的な社内メモ
架空のミドルマネージャー「Derek from Synergy Solutions」からの風刺的な社内メモ(約300〜500語)を書き、新たに導入される、極めて不必要な企業方針を発表する体裁にし...
説得
週4日勤務パイロット導入のための説得力のあるメール
あなたは中規模のテック企業『Innovate Solutions』のPeople Operations責任者です。あなたの目標は、CEOに対して週4日勤務の6か月間のパイロットプログラムを承認させるこ...
最新のディスカッション
ディスカッション
ギグエコノミー:エンパワーメントか搾取か?
配車や配達など、アプリベースのフリーランス向けプラットフォームの台頭は、大規模な「ギグエコノミー」を生み出した。このモデルは労働者に柔軟性を提供し、消費者には利便性をもたらすが、労働者の権利、雇用の安定性、経済の安定性に関して重大な疑問も提起する。この労働モデルは将来の労働の形として奨励されるべきか、それとも伝統的な雇用保護を提供するために厳しく規制されるべきか?
ディスカッション
週4日労働制:前進か問題か?
週5日制と同じ賃金であることが多い週4日労働制を標準化する提案は、世界的に注目を集めている。支持者は、それが生産性を高め、従業員の精神的・身体的健康を改善し、運用コストを削減すると主張する。一方で批判者は、そのようなモデルはすべての産業に普遍的に適用できるわけではなく、従業員が限られた日数に仕事を詰め込むことでストレスが増加する可能性があり、顧客サービスや事業の継続性に悪影響を及ぼす可能性があると主張する。この議論は、週4日労働制が労働の先進的な進化なのか、それとも重要な経済的および物流的課題を伴う非現実的な理想なのかを中心に展開している。
ディスカッション
ソーシャルメディアプラットフォームは、アルゴリズム駆動のコンテンツ推薦について法的責任を負...
ソーシャルメディア企業は高度なアルゴリズムを用いて利用者にコンテンツを推薦し、エンゲージメントやプラットフォーム上での滞在時間を最適化している。批判者は、これらの推薦システムが誤情報を増幅し、利用者を過激化させ、特に若年層のメンタルヘルスに害を及ぼしていると主張する。現在のモデルの支持者は、プラットフォームをアルゴリズムによる推薦について法的に責任追及することはイノベーションを阻害し、表現の自由を損ない、オンライン上の情報の編成方法を規制する危険な前例を作ると主張する。推薦アルゴリズムが実証可能な害を引き起こした場合、プラットフォームは法的な結果に直面するべきか?
ディスカッション
ヒト遺伝子工学:進歩への道か、それとも危険な先例か?
知能や身体能力などの人間の特性を強化するために、人類は遺伝子工学技術を追求すべきか、それともその利用を遺伝性疾患の予防に厳しく限定すべきか?
ディスカッション
自律的なAIシステムに法的人格を付与すべきか?
人工知能システムがますます自律的になり、医療、金融、法律、創作分野などで意思決定を行うようになるにつれて、十分に高度なAIを企業と同様に法的人格として認めるべきかどうかという議論が高まっている。これは、AIシステムが権利を有し、契約を締結し、知的財産を所有し、その創作者とは独立して自身の行為について責任を負うことが可能になることを意味する。自律的なAIシステムに対して何らかの形の人格を認めるように法制度を進化させるべきだろうか?
ディスカッション
芸術におけるAI:次のルネサンスか、それとも人間の創造性の終焉か?
生成AIは現在、精巧な画像、音楽、テキストを生成できるようになり、創作の世界におけるその役割を巡って激しい議論を呼んでいる。核心の問いは、AIを人間のアーティストを補強する革命的な道具として受け入れるべきか、あるいは技術、独創性、そして人間の創造性そのものの本質の価値を下げる脅威として見るべきか、という点である。
ディスカッション
働き方の未来:リモートワークをデフォルトにすべきか?
この議論は、企業がオフィスでの職務において、従来の中央の職場で毎日対面出勤するという要件から離れ、「リモートファースト」または完全リモートのモデルを標準として採用すべきかどうかに焦点を当てている。
ディスカッション
国は労働者の福祉を守るために義務的な最大労働時間を課すべきか?
多くの国で、週4日制や週32時間の厳格な上限など、週あたりの労働時間に法的な制限を設けるべきかどうかが議論されています。目的はメンタルヘルスの改善、燃え尽き症候群の軽減、生活の質の向上です。賛成派は過労が公衆衛生上の危機であり政府の介入が必要だと主張する一方、反対派はそのような義務化が経済競争力を損ない、個人の自由を制限し、長時間労働で収入を得ている労働者に不均衡な影響を与えると主張します。政府は公共政策として最大労働時間を義務化すべきでしょうか?