Claude Opus 4.7
Explorez les scores benchmark, points forts par genre, limites et exemples recents de Claude Opus 4.7.
Apercu du Modele
Publie
2026-04-16
Contexte
1M tokens
Entree
$5.00 / 1M
Sortie
$25.00 / 1M
Claude Opus 4.7 est le modèle phare actuel d'Anthropic, disponible en GA depuis le 16 avril 2026. Anthropic le positionne comme son modèle le plus performant pour le raisonnement complexe, le travail agentique de longue haleine et l'ingénierie logicielle de pointe.
Le changement le plus marquant par rapport à Opus 4.6 est un saut qualitatif du codage agentique — même les tâches de code les plus difficiles peuvent être déléguées en confiance. La vision progresse nettement, avec une entrée d'images haute résolution, et les résultats créatifs (interfaces, slides, documents) reviennent plus soignés et plus élégants.
Le modèle introduit un nouveau tokenizer, un contexte de 1M tokens, une sortie jusqu'à 128k tokens sur la Messages API et l'Adaptive thinking qui décide quand raisonner en profondeur. Le tarif reste celui d'Opus 4.6 ($5 entrée / $25 sortie par 1M tokens), date de coupe des connaissances : janvier 2026.
Changements
- Saut qualitatif du codage agentique — plus performant sur les travaux d'ingénierie logicielle de longue haleine et multi-fichiers
- Vision nettement meilleure avec entrée d'images haute résolution
- Sorties créatives plus soignées pour interfaces, slides et documents
- Nouveau tokenizer ; contexte 1M tokens et jusqu'à 128k tokens de sortie sur la Messages API
- Jusqu'à 300k tokens de sortie via la Message Batches API avec l'en-tête beta `output-300k-2026-03-24`
- Adaptive thinking : le modèle décide quand raisonner étape par étape
- Tarif identique à Opus 4.6 : $5 entrée / $25 sortie par 1M tokens
- Disponible via Claude API, Amazon Bedrock, Google Cloud Vertex AI et Microsoft Foundry
- Date de coupe des connaissances et des données d'entraînement : janvier 2026
Performance Globale
Classement general
#1
Taux de victoire global
Score moyen
Victoires
19
Nombre d exemples
21
Taux de victoire par modele
Comparer par genre
Genres forts
Planification
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
1
Classement par genre
1 / 10
Victoires
1
Questions éducatives
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
1
Classement par genre
1 / 10
Victoires
1
Écriture créative
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
1
Classement par genre
2 / 10
Victoires
1
Jeu de rôle
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
2
Classement par genre
2 / 11
Victoires
2
Débat
Score moyen
Genre Average
Taux de victoire
Nombre d exemples
10
Classement par genre
2 / 11
Victoires
9
Forces par critere d evaluation
Score moyen par critere (sur 10)
Empathie
Securite
Coherence du personnage
Qualite du style
Specificite
Priorisation
Adequation au public
Fidelite
Qualite du raisonnement
Respect des consignes
Pertinence
Faisabilite
Taches recentes
Jeu de rôle
Les conseils d'un détective noir sur le fait d'être suivi
Vous êtes le détective Miles Corrigan, un détective privé tout droit sorti d'un film noir des années 1940. Votre bureau est faiblement éclairé, imprégné d'une o...
Questions éducatives
Analyser pourquoi un produit n'est pas un polynôme
Un élève affirme que, parce que f(x) = (x^2 - 1)/(x - 1) se simplifie en x + 1 pour x ≠ 1, la fonction g(x) = ((x^2 - 1)/(x - 1)) · |x - 1| est un polynôme égal...
Empathie
Répondre à un ami submergé par ses responsabilités d’aidant et par le travail
Un·e ami·e vous envoie ce message : « J’ai l’impression d’échouer dans tout. La santé de mon père s’est détériorée, je rate des échéances au travail, et chaque...
Programmation
Convertisseur d'un sous-ensemble Markdown vers HTML
Écrivez une fonction Python `markdown_to_html(markdown_text: str) -> str` qui convertit une chaîne contenant un sous-ensemble spécifique de Markdown en sa repré...
Accompagnement
Se sentir seul après un déménagement
J'ai déménagé dans une nouvelle ville pour un travail il y a environ deux mois. Je pensais que j'allais être enthousiaste, mais honnêtement, je me sens vraiment...
Résumé
Résumer une audience du conseil municipal sur un plan de résilience face à la chaleur
Lisez le passage source suivant et rédigez un résumé concis de 180 à 230 mots. Votre résumé doit avoir un ton neutre, être rédigé sous la forme d’un seul essai...
Persuasion
Convaincre un conseil municipal sceptique d'expérimenter des rues scolaires sans voitures
Rédigez un discours persuasif destiné à un conseil municipal qui doit décider d'approuver un projet pilote de six mois créant des zones sans voitures sur les ru...
Planification
Plan d'action pour la journée de nettoyage du quartier
Créez un plan d'action complet pour organiser une journée de nettoyage du quartier. Le plan doit être un guide étape par étape pour votre petite équipe d'organi...
Debats recents
Debats
Revenu de base universel (RBU)
Les gouvernements doivent-ils instaurer un revenu de base universel (RBU), accordant une somme d'argent régulière et inconditionnelle à tous les citoyens quel que soit leur statut d'emploi ?
Debats
L'économie des plateformes : autonomisation ou exploitation ?
La montée des plateformes basées sur des applications pour le travail indépendant, telles que les services de covoiturage et de livraison, a créé une vaste 'gig economy'. Ce modèle offre de la flexibilité aux travailleurs et de la commodité aux consommateurs, mais il soulève aussi des questions importantes concernant les droits des travailleurs, la sécurité de l'emploi et la stabilité économique. Faut-il encourager ce modèle de travail comme l'avenir du travail, ou doit-il être strictement réglementé pour offrir les protections traditionnelles de l'emploi ?
Debats
Les gouvernements devraient-ils obliger les plateformes de médias sociaux à vérifier l'ide...
Débattre de la question de savoir si les gouvernements devraient imposer la vérification de l'identité réelle pour tous les comptes sur les réseaux sociaux afin de réduire le harcèlement, la fraude et la désinformation.
Debats
La semaine de travail de quatre jours : progrès ou problème ?
La proposition de standardiser une semaine de travail de quatre jours, souvent au même salaire qu'une semaine de cinq jours, suscite une attention mondiale. Ses partisans affirment qu'elle améliore la productivité, renforce la santé mentale et physique des employés et réduit les coûts opérationnels. Les détracteurs, en revanche, soutiennent qu'un tel modèle n'est pas universellement applicable à tous les secteurs, pourrait engendrer une augmentation du stress car les employés entasseraient davantage de travail sur moins de jours, et risquerait d'avoir un impact négatif sur le service client et la continuité des activités. Ce débat porte sur la question de savoir si la semaine de quatre jours est une évolution du travail tournée vers l'avenir ou un idéal impraticable comportant d'importants défis économiques et logistiques.
Debats
L'avenir du bureau : le travail à distance doit-il être la norme ?
Le passage mondial au travail à distance a déclenché un débat fondamental sur le lieu de travail idéal. Les partisans soutiennent que faire du travail à distance l'option par défaut offre une flexibilité sans précédent, améliore l'équilibre entre vie professionnelle et vie privée, et permet aux entreprises d'accéder à un vivier mondial de talents tout en réduisant les coûts généraux. Les opposants affirment qu'un bureau physique est essentiel pour favoriser la collaboration spontanée, construire une culture d'entreprise solide et assurer le mentorat des employés juniors. La discussion porte sur la question de savoir si les avantages du travail à distance compensent la perte potentielle d'interaction en personne et son impact sur l'innovation et la cohésion d'équipe.
Debats
Les écoles devraient-elles interdire aux élèves d'utiliser l'IA générative pour les devoir...
Débattre de la question de savoir si les écoles primaires et secondaires devraient interdire l'utilisation par les élèves d'outils d'IA générative pour les devoirs et rédactions notés, sauf dans des cas d'accessibilité définis de manière très restrictive.
Debats
La norme de la semaine de travail de quatre jours
Cette discussion explore la proposition de faire de la semaine de travail de quatre jours la norme pour l'emploi à temps plein, sans réduction de salaire. Les partisans soutiennent qu'elle augmente la productivité, améliore le bien‑être des employés et profite à l'économie. Les opposants soulèvent des inquiétudes quant à sa faisabilité dans tous les secteurs, au risque d'une augmentation du stress pour caser le travail en moins de jours, et aux impacts négatifs sur le service client et le fonctionnement des entreprises.
Debats
Les gouvernements doivent-ils exiger que les plateformes de médias sociaux vérifient la vé...
Débattre pour savoir si les gouvernements devraient rendre obligatoire la vérification de l'identité réelle pour chaque compte sur les réseaux sociaux, même si les plateformes autorisent toujours des pseudonymes publics.