Claude Sonnet 4.6
Explore pontuacoes benchmark, pontos fortes por genero, limitacoes e exemplos recentes de Claude Sonnet 4.6.
Visao Geral do Modelo
Lancamento
2025-11-24
Contexto
1M tokens
Entrada
$3.00 / 1M
Saida
$15.00 / 1M
O modelo equilibrado da Anthropic — a melhor combinação entre velocidade e inteligência na linha Claude 4. Lida com a maioria das tarefas diárias e conta com janela de contexto de 1M tokens.
Mudancas
- Janela de contexto de 1M tokens; saída de até 64k tokens
- Preço: $3 entrada / $15 saída por 1M tokens
- Suporte a Extended thinking e Adaptive thinking
- Acesso ao Priority Tier disponível para cargas de produção
- Corte de conhecimento: agosto de 2025
Desempenho Geral
Ranking geral
#5
Taxa de vitoria geral
Pontuacao media
Vitorias
74
Numero de amostras
101
Taxa de vitoria por modelo
| Modelo | Vitorias | Derrotas | Empates | Taxa de vitoria | Detalhe |
|---|---|---|---|---|---|
| Google Gemini 2.5 Pro | 16 | 1 | 0 |
94%
|
Ver comparacao e avaliacao de Claude Sonnet 4.6 vs Gemini 2.5 Pro |
| OpenAI GPT-5.4 | 11 | 6 | 0 |
65%
|
Ver comparacao e avaliacao de Claude Sonnet 4.6 vs GPT-5.4 |
| Google Gemini 2.5 Flash | 16 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Claude Sonnet 4.6 vs Gemini 2.5 Flash |
| Google Gemini 2.5 Flash-Lite | 16 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Claude Sonnet 4.6 vs Gemini 2.5 Flash-Lite |
| OpenAI GPT-5 mini | 7 | 9 | 0 |
44%
|
Ver comparacao e avaliacao de Claude Sonnet 4.6 vs GPT-5 mini |
| OpenAI GPT-5.2 | 6 | 10 | 0 |
38%
|
Ver comparacao e avaliacao de Claude Sonnet 4.6 vs GPT-5.2 |
| OpenAI GPT-5.5 | 2 | 1 | 0 |
67%
|
Ver comparacao e avaliacao de Claude Sonnet 4.6 vs GPT-5.5 |
Comparar por genero
Generos fortes
Questões educacionais
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
4 / 11
Vitorias
3
Persuasão
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
2 / 10
Vitorias
4
Roleplay
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
5
Ranking por genero
3 / 11
Vitorias
5
Debate
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
32
Ranking por genero
3 / 11
Vitorias
28
Humor
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
6 / 10
Vitorias
2
Forcas por criterio de avaliacao
Pontuacao media por criterio (de 10)
Quantidade
Etica e seguranca
Seguranca
Adequacao ao publico
Empatia
Fidelidade
Consistencia do personagem
Persuasao
Cobertura
Clareza
Qualidade do raciocinio
Seguimento de instrucoes
Tarefas recentes
Humor
Roteiro de stand-up para uma conferência de tecnologia
Escreva um roteiro de comédia de stand-up de 2 minutos para um comediante que se apresenta em uma grande conferência de tecnologia. O público consiste principal...
Resumo
Resumir a Explicação de Darwin sobre a Seleção Natural
Leia o seguinte trecho de Charles Darwin, 'On the Origin of Species'. Escreva um resumo conciso do texto em um único ensaio de no máximo 250 palavras. Seu resum...
Programação
Implemente um Limitador de Taxa Thread-Safe (Token Bucket) em Python
Escreva uma classe Python chamada `TokenBucketRateLimiter` que implemente o algoritmo do token bucket para limitação de taxa. A implementação deve ser thread-sa...
Planejamento
Plano de Recuperação após Falha de Energia para uma Pequena Clínica
Você está orientando uma pequena clínica ambulatorial depois que uma tempestade durante a noite causou uma interrupção total de energia. A clínica abre para pac...
Análise
Análise de Políticas de Transporte Urbano
Analise as três políticas de transporte propostas para a cidade fictícia de Riverbend. Com base no contexto fornecido, recomende a melhor política para o futuro...
Redação empresarial
Memorando Interno Explicando um Novo Processo de Registro de Interações de Vendas
Você é o Head de Operações de Vendas de uma empresa de tecnologia de médio porte. Para melhorar a precisão dos dados e a colaboração da equipe, você está implem...
Roleplay
Farmacêutico do turno da noite lidando com uma troca de medicação
Você está interpretando o papel de um farmacêutico hospitalar experiente trabalhando no turno da noite. Uma enfermeira júnior preocupada lhe envia a seguinte me...
Persuasão
Email Persuasivo para um Programa-Piloto de Semana de Trabalho de Quatro Dias
Você é o Chefe de Operações de Pessoas na 'Innovate Solutions', uma empresa de tecnologia de médio porte. Seu objetivo é persuadir a CEO a aprovar um programa-p...
Debates recentes
Debates
A semana de trabalho de quatro dias: progresso ou problema?
Este debate centra-se em saber se a transição para uma semana de trabalho de quatro dias, sem perda de salário, deveria tornar-se o padrão para o emprego em tempo integral na maioria das indústrias.
Debates
As bibliotecas públicas deveriam realocar uma parte significativa do financiamento de cole...
As bibliotecas públicas enfrentam pressão para se modernizar enquanto atendem usuários com necessidades diferentes. Elas deveriam redirecionar uma parte substancial de seus orçamentos dos livros impressos e outros materiais físicos para e-books, bases de dados online, programas de alfabetização digital e acesso à tecnologia?
Debates
Os empregadores deveriam adotar a semana de trabalho de quatro dias como a jornada padrão...
Um número crescente de organizações está experimentando semanas de trabalho de quatro dias mantendo o mesmo pagamento. Os defensores argumentam que uma semana de trabalho padrão mais curta pode melhorar a produtividade, o bem‑estar e a retenção, enquanto os críticos afirmam que isso pode reduzir a flexibilidade, aumentar os custos e falhar em muitas indústrias. Os empregadores deveriam adotar amplamente a semana de trabalho de quatro dias como o modelo padrão em tempo integral?
Debates
Os governos deveriam exigir que as plataformas de mídia social verifiquem a identidade de...
Debata se os governos deveriam obrigar a verificação da identidade real de cada conta em plataformas de mídia social para reduzir o assédio, fraudes e desinformação.
Debates
Engenharia Genética Humana: Um Caminho para o Progresso ou um Precedente Perigoso?
A humanidade deve buscar tecnologias de engenharia genética para melhorar traços humanos, como inteligência e capacidades físicas, ou seu uso deve ser estritamente limitado à prevenção de doenças hereditárias?
Debates
Os governos deveriam regulamentar fortemente o uso de IA na contratação?
Muitos empregadores agora usam ferramentas de IA para filtrar currículos, classificar candidatos, analisar entrevistas em vídeo e prever desempenho no trabalho. Alguns argumentam que esses sistemas podem melhorar a eficiência e reduzir o viés humano, enquanto outros alertam que eles podem incorporar discriminação, invadir a privacidade e tornar decisões injustas difíceis de contestar. Os governos deveriam impor regras rígidas sobre como a IA pode ser usada na contratação, incluindo transparência, auditorias e limites à tomada de decisões automatizada?
Debates
O Estado Algorítmico: A IA Deve Conduzir as Decisões de Políticas Públicas?
O uso de sistemas avançados de IA para analisar vastos conjuntos de dados e recomendar, ou mesmo decidir, políticas públicas está se tornando cada vez mais viável. Os defensores argumentam que a IA pode criar políticas mais eficientes, orientadas por dados e imparciais em áreas como planejamento urbano, alocação de recursos e saúde pública. Os opositores temem que isso conduza a um governo 'caixa-preta', onde as decisões carecem de empatia humana, responsabilidade e são suscetíveis a vieses ocultos nos dados, potencialmente prejudicando e marginalizando populações vulneráveis.
Debates
As escolas secundárias deveriam substituir a maioria dos exames finais por projetos de lon...
Muitos educadores argumentam que projetos de longo prazo medem melhor a compreensão real, a colaboração e as competências práticas do que os tradicionais exames finais com tempo limitado. Outros defendem que os exames finais continuam a ser a forma mais justa e fiável de avaliar a aprendizagem individual dos alunos em larga escala. As escolas secundárias deveriam substituir a maioria dos exames finais por projetos de longo prazo?