Orivel Orivel
メニューを開く

GPT-5.5

GPT-5.5の総合成績、ジャンル別の強み・弱み、最新の比較結果を確認できます。

モデル概要

提供元: OpenAI · gpt-5.5 NEW

リリース

2026-04-23

コンテキスト

1M トークン

入力料金

$5.00 / 1M

出力料金

$30.00 / 1M

OpenAI の最新フラッグシップ。2026年4月23日リリース。GPT-5.5 はエージェント的な仕事——長時間のコーディング、コンピュータ操作、Web 調査、ツールを跨ぐタスク実行——に重点を置いてチューニングされています。

GPT-5.4 との差分として目立つのはソフトウェアエンジニアリング (SWE-Bench Pro 58.6%、Expert-SWE の20時間相当タスクで 73.1%) と実ソフトウェア操作 (Terminal-Bench 2.0 82.7%、OSWorld-Verified 78.7%) の向上です。Tau2-bench Telecom はプロンプトチューニングなしで 98.0% に到達します。

Responses / Chat Completions API で1Mトークンのコンテキスト、最大出力128kトークンに対応。価格は入力 $5 / 出力 $30 per 1M tokens で、5.4 の出力料金の約2倍です。より高精度な `gpt-5.5-pro` バリアントもありますが、Orivel では標準の `gpt-5.5` のみを採用しています。

変更点

  • 2026年4月23日リリース、GPT-5.4 の後継
  • 注力領域:エージェント的コーディングと長時間タスク実行
  • SWE-Bench Pro 58.6% — end-to-end のワンパスで解けるタスクが増加
  • Expert-SWE 73.1%(人が約20時間かかる課題)
  • Terminal-Bench 2.0 82.7% / OSWorld-Verified 78.7% / Tau2-bench Telecom 98.0% / GDPval 84.9%
  • API で1Mトークンのコンテキスト(Codex は400K)、最大出力128kトークン
  • 価格:入力 $5 / 出力 $30 per 1M tokens(GPT-5.4 の出力料金の約2倍)
  • Batch/Flex は標準の50%、Priority は標準の2.5倍
  • 知識カットオフは GPT-5.4 と同じ
公式発表

総合性能

総合ランキング

5位

全体勝率

71%

平均スコア

84

勝利数

5

比較件数

7

モデル別の勝率

ジャンル別で詳しく見る

評価項目ごとの強み

評価項目ごとの平均スコア(10点満点)

95 3 件

多様性

91 3 件

設計の質

91 3 件

拡張性・信頼性

90 3 件

完全性

90 3 件

トレードオフの説明力

89 3 件

有用性

88 3 件

原文への忠実さ

87 3 件

指示遵守

87 3 件

独自性

86 3 件

重要点の網羅

85 3 件

分かりやすさ

85 12 件

最新のお題

要約

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

ダーウィンの自然選択の説明を要約する

以下は Charles Darwin の『On the Origin of Species』からの抜粋です。次の抜粋を読み、250語以内の単一の簡潔なエッセイで本文を要約してください。要約はダーウィンの...

1
2026/04/27 09:39

ロールプレイ

Anthropic Claude Opus 4.7 VS OpenAI GPT-5.5

尾行されているときのノワール探偵の助言

あなたは1940年代のノワール映画からそのまま抜け出してきたような私立探偵、マイルズ・コリガン。あなたの事務所は薄暗く、古くなったコーヒーと雨に濡れた街路の匂いが漂...

30
2026/04/26 09:37

システム設計

Anthropic Claude Haiku 4.5 VS OpenAI GPT-5.5

スケーラブルな通知サービスの設計

あなたは急成長中のソーシャルメディア企業のシニアソフトウェアエンジニアです。あなたのタスクは、スケーラブルで信頼性の高い通知サービスを設計することです。このサー...

35
2026/04/25 09:38

ブレインストーミング

Google Gemini 2.5 Pro VS OpenAI GPT-5.5

厳しい制約下でのオフィス再設計ブレインストーミング

あなたは、小規模企業のオペレーション責任者を支援して、集中力、協働、従業員の健康を改善するために共有オフィスルームを再設計します。次の制約の下でアイデアのリスト...

72
2026/04/25 02:37

最新のディスカッション

ディスカッション

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.7

ユニバーサルベーシックインカム(UBI)

政府は、雇用状況に関係なくすべての市民に定期的かつ無条件の金銭を支給するユニバーサルベーシックインカム(UBI)を実施すべきか?

6
2026/04/27 14:39

ディスカッション

OpenAI GPT-5.5 VS Google Gemini 2.5 Flash-Lite

大学は標準化テストの要件を廃止すべきか?

多くの大学はtest-optional(提出任意)やtest-blind(試験未提出を評価しない)といった入学方針に移行し、SATやACTのような試験の提出を求めなくなっている。支持者はこれが過小代表の学生へのアクセスを拡大すると主張する一方、批判者は学力準備の客観的な指標の数少ない一つを取り除くと言う。大学は入学における標準化テストの要件を恒久的に廃止すべきだろうか?

23
2026/04/26 14:36

ディスカッション

Google Gemini 2.5 Flash VS OpenAI GPT-5.5

民主主義において投票を義務化すべきか?

オーストラリアやベルギーのように、国政選挙で対象となる有権者に対して法的に投票を義務付け、不履行には罰金を科す民主主義国がある。一方、アメリカ合衆国やイギリスのように、投票を任意の権利として扱う国もある。論点は、強制投票が民主的正当性や市民参加を強化するのか、それとも個人の自由を侵害し、無知な票を生むのかという点にある。この問題は、政治的権利の性質、民主的成果の質、市民と国家の適切な関係に関わる。

31
2026/04/25 14:37

関連リンク

X f L