GPT-5.5
Explorez les scores benchmark, points forts par genre, limites et exemples recents de GPT-5.5.
Apercu du Modele
Publie
2026-04-23
Contexte
1M tokens
Entree
$5.00 / 1M
Sortie
$30.00 / 1M
Le modèle phare le plus récent d'OpenAI, publié le 23 avril 2026. GPT-5.5 est calibré pour le travail agentique : codage de longue haleine, utilisation de l'ordinateur, recherche web et exécution de tâches enchaînant des outils sont les axes prioritaires.
Par rapport à GPT-5.4, les gains visibles concernent l'ingénierie logicielle (SWE-Bench Pro 58.6% end-to-end en une seule passe, Expert-SWE 73.1% sur des tâches de ~20 heures) et la maîtrise de logiciels réels (Terminal-Bench 2.0 82.7%, OSWorld-Verified 78.7%). Tau2-bench Telecom atteint 98.0% sans ajustement de prompt.
Le modèle offre un contexte de 1M tokens via les APIs Responses et Chat Completions, une sortie maximale de 128k, et une tarification qui double celle de 5.4 côté sortie ($5 entrée / $30 sortie par 1M tokens). Une variante `gpt-5.5-pro` plus précise existe séparément à tarif premium ; Orivel n'utilise que la variante standard `gpt-5.5`.
Changements
- Publié le 23 avril 2026 comme successeur de GPT-5.4
- Focus : codage agentique et exécution de tâches de longue haleine
- SWE-Bench Pro 58.6% — davantage de tâches résolues end-to-end en une seule passe
- Expert-SWE 73.1% sur des tâches au temps humain estimé à ~20 heures
- Terminal-Bench 2.0 82.7%, OSWorld-Verified 78.7%, Tau2-bench Telecom 98.0%, GDPval 84.9%
- Contexte 1M tokens dans l'API (400K dans Codex) ; sortie maximale 128k
- Tarif : $5 entrée / $30 sortie par 1M tokens — environ 2× le tarif de sortie de GPT-5.4
- Batch/Flex à 50% du standard ; Priority à 2,5× le standard
- Date de coupe des connaissances inchangée par rapport à GPT-5.4
Performance Globale
Classement general
#5
Taux de victoire global
Score moyen
Victoires
5
Nombre d exemples
7
Taux de victoire par modele
Comparer par genre
Genres forts
Brainstorming
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
1
Classement par genre
1 / 10
Victoires
1
Conception de systèmes
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
1
Classement par genre
2 / 10
Victoires
1
Débat
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
3
Classement par genre
6 / 11
Victoires
2
Résumé
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
1
Classement par genre
2 / 11
Victoires
1
Forces par critere d evaluation
Score moyen par critere (sur 10)
Quantite
Diversite
Qualite de l architecture
Scalabilite et fiabilite
Completude
Analyse des compromis
Utilite
Fidelite
Respect des consignes
Originalite
Couverture
Clarte
Taches recentes
Résumé
Résumer l'explication de la sélection naturelle par Darwin
Lisez l'extrait suivant de Charles Darwin, «De l'origine des espèces». Rédigez un résumé concis du texte en un seul essai de pas plus de 250 mots. Votre résumé...
Jeu de rôle
Les conseils d'un détective noir sur le fait d'être suivi
Vous êtes le détective Miles Corrigan, un détective privé tout droit sorti d'un film noir des années 1940. Votre bureau est faiblement éclairé, imprégné d'une o...
Conception de systèmes
Concevoir un service de notifications évolutif
Vous êtes ingénieur logiciel senior dans une entreprise de réseaux sociaux en forte croissance. Votre tâche est de concevoir un service de notifications évoluti...
Brainstorming
Remue-méninges pour la refonte d'un espace de bureau sous fortes contraintes
Vous aidez le responsable des opérations d'une petite entreprise à repenser une salle de bureau partagée afin d'améliorer la concentration, la collaboration et...
Debats recents
Debats
Revenu de base universel (RBU)
Les gouvernements doivent-ils instaurer un revenu de base universel (RBU), accordant une somme d'argent régulière et inconditionnelle à tous les citoyens quel que soit leur statut d'emploi ?
Debats
Les universités devraient-elles abolir l'exigence des tests standardisés ?
De nombreuses universités sont passées à des admissions « test optionnel » ou « test aveugle », supprimant l'obligation d'examens comme le SAT et l'ACT. Les partisans soutiennent que cela élargit l'accès aux étudiants sous-représentés, tandis que les détracteurs affirment que cela supprime l'une des rares mesures objectives de l'aptitude académique. Les universités devraient-elles abolir définitivement les exigences de tests standardisés pour les admissions ?
Debats
Le vote devrait-il être obligatoire dans les démocraties ?
Certaines démocraties, comme l'Australie et la Belgique, exigent légalement que les citoyens éligibles votent aux élections nationales, avec des amendes en cas de non-respect. D'autres, comme les États-Unis et le Royaume-Uni, considèrent le vote comme un droit volontaire. Le débat porte sur la question de savoir si le vote obligatoire renforce la légitimité démocratique et l'engagement civique, ou s'il porte atteinte à la liberté individuelle et produit des bulletins non informés. Cette question touche à la nature des droits politiques, à la qualité des résultats démocratiques et à la relation appropriée entre les citoyens et l'État.