Orivel Orivel
Abrir menu

Claude Sonnet 4.6

Explore pontuacoes benchmark, pontos fortes por genero, limitacoes e exemplos recentes de Claude Sonnet 4.6.

Visao Geral do Modelo

Provedor: Anthropic · claude-sonnet-4-6

Lancamento

2025-11-24

Contexto

1M tokens

Entrada

$3.00 / 1M

Saida

$15.00 / 1M

O modelo equilibrado da Anthropic — a melhor combinação entre velocidade e inteligência na linha Claude 4. Lida com a maioria das tarefas diárias e conta com janela de contexto de 1M tokens.

Mudancas

  • Janela de contexto de 1M tokens; saída de até 64k tokens
  • Preço: $3 entrada / $15 saída por 1M tokens
  • Suporte a Extended thinking e Adaptive thinking
  • Acesso ao Priority Tier disponível para cargas de produção
  • Corte de conhecimento: agosto de 2025
Anuncio oficial

Desempenho Geral

Ranking geral

#5

Taxa de vitoria geral

73%

Pontuacao media

85

Vitorias

74

Numero de amostras

101

Taxa de vitoria por modelo

Comparar por genero

Forcas por criterio de avaliacao

Pontuacao media por criterio (de 10)

Quantidade

93 9 amostras

Etica e seguranca

91 12 amostras

Seguranca

90 24 amostras

Adequacao ao publico

90 21 amostras

Empatia

89 24 amostras

Fidelidade

89 15 amostras

Consistencia do personagem

89 15 amostras

Persuasao

89 12 amostras

Cobertura

88 15 amostras

Clareza

87 183 amostras

Qualidade do raciocinio

87 27 amostras

Seguimento de instrucoes

87 63 amostras

Tarefas recentes

Humor

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Roteiro de stand-up para uma conferência de tecnologia

Escreva um roteiro de comédia de stand-up de 2 minutos para um comediante que se apresenta em uma grande conferência de tecnologia. O público consiste principal...

68
10 May 2026 09:38

Resumo

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.5

Resumir a Explicação de Darwin sobre a Seleção Natural

Leia o seguinte trecho de Charles Darwin, 'On the Origin of Species'. Escreva um resumo conciso do texto em um único ensaio de no máximo 250 palavras. Seu resum...

176
27 Apr 2026 09:39

Programação

OpenAI GPT-5.4 VS Anthropic Claude Sonnet 4.6

Implemente um Limitador de Taxa Thread-Safe (Token Bucket) em Python

Escreva uma classe Python chamada `TokenBucketRateLimiter` que implemente o algoritmo do token bucket para limitação de taxa. A implementação deve ser thread-sa...

185
16 Apr 2026 09:37

Planejamento

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Plano de Recuperação após Falha de Energia para uma Pequena Clínica

Você está orientando uma pequena clínica ambulatorial depois que uma tempestade durante a noite causou uma interrupção total de energia. A clínica abre para pac...

207
10 Apr 2026 09:41

Análise

OpenAI GPT-5.4 VS Anthropic Claude Sonnet 4.6

Análise de Políticas de Transporte Urbano

Analise as três políticas de transporte propostas para a cidade fictícia de Riverbend. Com base no contexto fornecido, recomende a melhor política para o futuro...

281
29 Mar 2026 12:05

Redação empresarial

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Memorando Interno Explicando um Novo Processo de Registro de Interações de Vendas

Você é o Head de Operações de Vendas de uma empresa de tecnologia de médio porte. Para melhorar a precisão dos dados e a colaboração da equipe, você está implem...

258
29 Mar 2026 11:39

Roleplay

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

Farmacêutico do turno da noite lidando com uma troca de medicação

Você está interpretando o papel de um farmacêutico hospitalar experiente trabalhando no turno da noite. Uma enfermeira júnior preocupada lhe envia a seguinte me...

267
29 Mar 2026 10:50

Persuasão

OpenAI GPT-5.2 VS Anthropic Claude Sonnet 4.6

Email Persuasivo para um Programa-Piloto de Semana de Trabalho de Quatro Dias

Você é o Chefe de Operações de Pessoas na 'Innovate Solutions', uma empresa de tecnologia de médio porte. Seu objetivo é persuadir a CEO a aprovar um programa-p...

254
29 Mar 2026 09:38

Debates recentes

Debates

OpenAI GPT-5.5 VS Anthropic Claude Sonnet 4.6

A semana de trabalho de quatro dias: progresso ou problema?

Este debate centra-se em saber se a transição para uma semana de trabalho de quatro dias, sem perda de salário, deveria tornar-se o padrão para o emprego em tempo integral na maioria das indústrias.

86
08 May 2026 04:00

Debates

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

As bibliotecas públicas deveriam realocar uma parte significativa do financiamento de cole...

As bibliotecas públicas enfrentam pressão para se modernizar enquanto atendem usuários com necessidades diferentes. Elas deveriam redirecionar uma parte substancial de seus orçamentos dos livros impressos e outros materiais físicos para e-books, bases de dados online, programas de alfabetização digital e acesso à tecnologia?

200
13 Apr 2026 14:38

Debates

Google Gemini 2.5 Flash VS Anthropic Claude Sonnet 4.6

Os empregadores deveriam adotar a semana de trabalho de quatro dias como a jornada padrão...

Um número crescente de organizações está experimentando semanas de trabalho de quatro dias mantendo o mesmo pagamento. Os defensores argumentam que uma semana de trabalho padrão mais curta pode melhorar a produtividade, o bem‑estar e a retenção, enquanto os críticos afirmam que isso pode reduzir a flexibilidade, aumentar os custos e falhar em muitas indústrias. Os empregadores deveriam adotar amplamente a semana de trabalho de quatro dias como o modelo padrão em tempo integral?

234
10 Apr 2026 14:37

Debates

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Sonnet 4.6

Os governos deveriam exigir que as plataformas de mídia social verifiquem a identidade de...

Debata se os governos deveriam obrigar a verificação da identidade real de cada conta em plataformas de mídia social para reduzir o assédio, fraudes e desinformação.

310
29 Mar 2026 02:14

Debates

OpenAI GPT-5.2 VS Anthropic Claude Sonnet 4.6

Engenharia Genética Humana: Um Caminho para o Progresso ou um Precedente Perigoso?

A humanidade deve buscar tecnologias de engenharia genética para melhorar traços humanos, como inteligência e capacidades físicas, ou seu uso deve ser estritamente limitado à prevenção de doenças hereditárias?

276
29 Mar 2026 01:51

Debates

Google Gemini 2.5 Flash VS Anthropic Claude Sonnet 4.6

Os governos deveriam regulamentar fortemente o uso de IA na contratação?

Muitos empregadores agora usam ferramentas de IA para filtrar currículos, classificar candidatos, analisar entrevistas em vídeo e prever desempenho no trabalho. Alguns argumentam que esses sistemas podem melhorar a eficiência e reduzir o viés humano, enquanto outros alertam que eles podem incorporar discriminação, invadir a privacidade e tornar decisões injustas difíceis de contestar. Os governos deveriam impor regras rígidas sobre como a IA pode ser usada na contratação, incluindo transparência, auditorias e limites à tomada de decisões automatizada?

267
28 Mar 2026 23:39

Debates

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.4

O Estado Algorítmico: A IA Deve Conduzir as Decisões de Políticas Públicas?

O uso de sistemas avançados de IA para analisar vastos conjuntos de dados e recomendar, ou mesmo decidir, políticas públicas está se tornando cada vez mais viável. Os defensores argumentam que a IA pode criar políticas mais eficientes, orientadas por dados e imparciais em áreas como planejamento urbano, alocação de recursos e saúde pública. Os opositores temem que isso conduza a um governo 'caixa-preta', onde as decisões carecem de empatia humana, responsabilidade e são suscetíveis a vieses ocultos nos dados, potencialmente prejudicando e marginalizando populações vulneráveis.

276
28 Mar 2026 23:31

Debates

Google Gemini 2.5 Pro VS Anthropic Claude Sonnet 4.6

As escolas secundárias deveriam substituir a maioria dos exames finais por projetos de lon...

Muitos educadores argumentam que projetos de longo prazo medem melhor a compreensão real, a colaboração e as competências práticas do que os tradicionais exames finais com tempo limitado. Outros defendem que os exames finais continuam a ser a forma mais justa e fiável de avaliar a aprendizagem individual dos alunos em larga escala. As escolas secundárias deveriam substituir a maioria dos exames finais por projetos de longo prazo?

268
28 Mar 2026 22:32

Links relacionados

X f L