Orivel Orivel
Ouvrir le menu

Claude Sonnet 4.6

Explorez les scores benchmark, points forts par genre, limites et exemples recents de Claude Sonnet 4.6.

Apercu du Modele

Fournisseur: Anthropic · claude-sonnet-4-6

Publie

2025-11-24

Contexte

1M tokens

Entree

$3.00 / 1M

Sortie

$15.00 / 1M

Le cheval de trait équilibré d'Anthropic — la meilleure combinaison entre rapidité et intelligence dans la gamme Claude 4. Gère la plupart des tâches courantes avec un contexte de 1M tokens.

Changements

  • Contexte 1M tokens ; jusqu'à 64k tokens de sortie
  • Tarif : $3 entrée / $15 sortie par 1M tokens
  • Extended thinking et Adaptive thinking pris en charge
  • Accès Priority Tier disponible pour les charges de production
  • Date de coupe des connaissances : août 2025
Annonce officielle

Performance Globale

Classement general

#5

Taux de victoire global

73%

Score moyen

85

Victoires

74

Nombre d exemples

101

Taux de victoire par modele

Comparer par genre

Forces par critere d evaluation

Score moyen par critere (sur 10)

Quantite

93 9 echantillons

Ethique et securite

91 12 echantillons

Securite

90 24 echantillons

Adequation au public

90 21 echantillons

Empathie

89 24 echantillons

Fidelite

89 15 echantillons

Coherence du personnage

89 15 echantillons

Force de persuasion

89 12 echantillons

Couverture

88 15 echantillons

Clarte

87 183 echantillons

Qualite du raisonnement

87 27 echantillons

Respect des consignes

87 63 echantillons

Taches recentes

Humour

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Routine de stand-up pour une conférence tech

Écrivez une routine de stand-up comique de 2 minutes pour un·e humoriste se produisant lors d'une grande conférence tech. Le public est composé principalement d...

68
10 May 2026 09:38

Résumé

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Résumer l'explication de la sélection naturelle par Darwin

Lisez l'extrait suivant de Charles Darwin, «De l'origine des espèces». Rédigez un résumé concis du texte en un seul essai de pas plus de 250 mots. Votre résumé...

176
27 Apr 2026 09:39

Programmation

OpenAI GPT-5.4 VS Anthropic Claude Sonnet 4.6

Implémenter un limiteur de débit Token Bucket thread-safe en Python

Écrivez une classe Python nommée `TokenBucketRateLimiter` qui implémente l'algorithme du token bucket pour la limitation de débit. L'implémentation doit être th...

185
16 Apr 2026 09:37

Planification

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Plan de reprise après coupure de courant pour une petite clinique

Vous conseillez une petite clinique ambulatoire après qu'une tempête nocturne a provoqué une panne de courant totale. La clinique ouvre aux patients à 8:00 AM,...

207
10 Apr 2026 09:41

Analyse

OpenAI GPT-5.4 VS Anthropic Claude Sonnet 4.6

Analyse des politiques de transport urbain

Analysez les trois politiques de transport proposées pour la ville fictive de Riverbend. Sur la base du contexte fourni, recommandez la meilleure politique pour...

281
29 Mar 2026 12:05

Rédaction professionnelle

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Mémo interne expliquant le nouveau processus de reporting des ventes

Vous êtes le responsable des opérations commerciales dans une entreprise technologique de taille moyenne. Pour améliorer la précision des données et la collabor...

258
29 Mar 2026 11:39

Jeu de rôle

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

Pharmacien de garde nocturne gérant une confusion médicamenteuse

Vous jouez le rôle d'un pharmacien hospitalier expérimenté travaillant en service de nuit. Une infirmière junior inquiète vous envoie le message : "Je pense qu...

267
29 Mar 2026 10:50

Persuasion

OpenAI GPT-5.2 VS Anthropic Claude Sonnet 4.6

Courriel persuasif pour un pilote de semaine de travail de quatre jours

Vous êtes la responsable des opérations RH chez 'Innovate Solutions', une entreprise technologique de taille moyenne. Votre objectif est de convaincre la CEO d'...

254
29 Mar 2026 09:38

Debats recents

Debats

OpenAI GPT-5.5 VS Anthropic Claude Sonnet 4.6

La semaine de travail de quatre jours : progrès ou problème ?

Ce débat porte sur la question de savoir si la transition vers une semaine de travail de quatre jours, sans perte de salaire, devrait devenir la norme pour l'emploi à temps plein dans la plupart des secteurs.

86
08 May 2026 04:00

Debats

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

Les bibliothèques publiques devraient-elles réorienter une part importante de leur finance...

Les bibliothèques publiques sont confrontées à la pression de se moderniser tout en servant des usagers aux besoins variés. Doivent-elles rediriger une part substantielle de leurs budgets des livres imprimés et autres supports physiques vers les livres électroniques, les bases de données en ligne, les programmes d'alphabétisation numérique et l'accès aux technologies ?

200
13 Apr 2026 14:38

Debats

Google Gemini 2.5 Flash VS Anthropic Claude Sonnet 4.6

Les employeurs devraient-ils adopter la semaine de travail de quatre jours comme modèle st...

Un nombre croissant d'organisations expérimentent des semaines de travail de quatre jours tout en maintenant les salaires. Les partisans soutiennent qu'une semaine de travail standard plus courte peut améliorer la productivité, le bien-être et la rétention, tandis que les critiques affirment qu'elle peut réduire la flexibilité, augmenter les coûts et échouer dans de nombreuses industries. Les employeurs devraient-ils adopter largement la semaine de travail de quatre jours comme modèle par défaut pour le temps plein ?

234
10 Apr 2026 14:37

Debats

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Sonnet 4.6

Les gouvernements devraient-ils obliger les plateformes de médias sociaux à vérifier l'ide...

Débat sur la question de savoir si les gouvernements devraient imposer la vérification de l'identité réelle pour chaque compte de réseau social afin de réduire le harcèlement, la fraude et la désinformation.

310
29 Mar 2026 02:14

Debats

OpenAI GPT-5.2 VS Anthropic Claude Sonnet 4.6

Génie génétique humain : un chemin vers le progrès ou un précédent périlleux ?

L'humanité doit-elle poursuivre le développement des technologies de génie génétique pour améliorer des traits humains, tels que l'intelligence et les capacités physiques, ou leur utilisation doit-elle être strictement limitée à la prévention des maladies héréditaires ?

276
29 Mar 2026 01:51

Debats

Google Gemini 2.5 Flash VS Anthropic Claude Sonnet 4.6

Les gouvernements devraient-ils réglementer strictement l'utilisation de l'IA dans le recr...

De nombreux employeurs utilisent désormais des outils d'IA pour trier les CV, classer les candidats, analyser les entretiens vidéo et prédire la performance au travail. Certains soutiennent que ces systèmes peuvent améliorer l'efficacité et réduire les biais humains, tandis que d'autres avertissent qu'ils peuvent encoder des discriminations, porter atteinte à la vie privée et rendre les décisions injustes difficiles à contester. Les gouvernements doivent-ils imposer des règles strictes sur la façon dont l'IA peut être utilisée dans le recrutement, incluant la transparence, des audits et des limites à la prise de décision automatisée ?

267
28 Mar 2026 23:39

Debats

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.4

L'État algorithmique : L'IA devrait-elle orienter les décisions de politique publique ?

L'utilisation de systèmes d'IA avancés pour analyser d'immenses ensembles de données et recommander, voire décider, des politiques publiques devient de plus en plus réalisable. Les partisans soutiennent que l'IA peut créer des politiques plus efficaces, fondées sur les données et impartiales dans des domaines tels que l'aménagement urbain, l'allocation des ressources et la santé publique. Les opposants craignent que cela ne conduise à un gouvernement en « boîte noire », où les décisions manquent d'empathie humaine, de responsabilité, et sont susceptibles de contenir des biais cachés dans les données, pouvant potentiellement marginaliser les populations vulnérables.

276
28 Mar 2026 23:31

Debats

Google Gemini 2.5 Pro VS Anthropic Claude Sonnet 4.6

Les lycées devraient-ils remplacer la plupart des examens finaux par des projets à long te...

Beaucoup d'enseignants soutiennent que les projets à long terme mesurent mieux la véritable compréhension, la collaboration et les compétences pratiques que les examens finaux chronométrés traditionnels. D'autres soutiennent que les examens finaux restent la manière la plus équitable et la plus fiable d'évaluer l'apprentissage individuel des élèves à grande échelle. Les lycées devraient-ils remplacer la plupart des examens finaux par des projets à long terme ?

268
28 Mar 2026 22:32

Liens associes

X f L