Orivel Orivel
Abrir menu

Claude Sonnet 4.6

Explore pontuacoes benchmark, pontos fortes por genero, limitacoes e exemplos recentes de Claude Sonnet 4.6.

Visao Geral do Modelo

Provedor

Anthropic

Classe

Modelo superior Modelo padrao Modelo leve

Desempenho Geral

Ranking geral

#5

Taxa de vitoria geral

70%

Pontuacao media

85

Vitorias

51

Numero de amostras

73

Taxa de vitoria por modelo

Comparar por genero

Forcas por criterio de avaliacao

Pontuacao media por criterio (de 10)

Quantidade

93 9 amostras

Etica e seguranca

91 9 amostras

Adequacao ao publico

91 18 amostras

Seguranca

90 24 amostras

Empatia

89 24 amostras

Persuasao

89 9 amostras

Consistencia do personagem

89 9 amostras

Fidelidade

89 12 amostras

Capacidade de acao

88 15 amostras

Qualidade do raciocinio

88 24 amostras

Clareza

88 156 amostras

Estrutura

87 48 amostras

Tarefas recentes

Análise

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Análise de uma Política de Semana de Trabalho de Quatro Dias para uma Cidade

A cidade de Rivertown, um município de médio porte com aproximadamente 2.000 funcionários municipais, está considerando uma proposta para passar a uma semana de...

29
23 Mar 2026 09:38

Redação empresarial

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Email ao Cliente Explicando um Atraso no Projeto e o Plano de Recuperação

Você é um gerente de projeto em uma consultoria de software. Escreva um e-mail para o diretor de operações de um cliente sobre um atraso de duas semanas no lanç...

29
23 Mar 2026 08:09

Escrita criativa

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Reclamação Formal a um Serviço de Controle de Pragas Mágicas

Escreva uma carta formal de reclamação para 'WyrmGuard Pest Control'. O seu personagem os contratou para remover uma infestação menor de gnomos de jardim. O ser...

30
23 Mar 2026 08:02

Redação empresarial

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

Responder a uma Entrega Atrasada ao Cliente com um Plano de Recuperação

Você é o gerente de operações de uma pequena consultoria de software. Um cliente recebeu a promessa de entrega de um painel de relatórios até sexta-feira, mas s...

37
22 Mar 2026 20:48

Empatia

OpenAI GPT-5.4 VS Anthropic Claude Sonnet 4.6

Respondendo a um membro da comunidade chateado

Você é um moderador voluntário de um fórum online de entusiastas sobre sintetizadores vintage. Um usuário, "SynthWizard88", está muito chateado porque você remo...

49
21 Mar 2026 10:05

Questões educacionais

OpenAI GPT-5.2 VS Anthropic Claude Sonnet 4.6

Explicando o Paradoxo do Demônio de Maxwell

Explique o experimento mental conhecido como Demônio de Maxwell. Detalhe por que ele aparenta violar a Segunda Lei da Termodinâmica. Finalmente, apresente a res...

50
21 Mar 2026 09:32

Resumo

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Resuma a História do Canal de Suez

Resuma o texto fornecido sobre a história do Canal de Suez em um único parágrafo coerente de 200 a 250 palavras. Seu resumo deve cobrir com precisão os seguinte...

46
21 Mar 2026 06:04

Planejamento

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Plano de Mudança de Fim de Semana com Restrições Apertadas

You are helping a person plan a one-day apartment move on Saturday. They are moving from a studio apartment on the 3rd floor (no elevator) to a new apartment 25...

51
20 Mar 2026 16:49

Debates recentes

Debates

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash

As universidades devem priorizar a preparação para a carreira em detrimento de uma educaçã...

Debata se faculdades e universidades devem concentrar-se principalmente em equipar os estudantes com habilidades prontas para o mercado de trabalho, ou se devem preservar uma missão mais ampla que enfatize o pensamento crítico, a cidadania e a exposição a muitos campos, mesmo quando esses resultados estão menos diretamente ligados ao emprego.

51
21 Mar 2026 07:10

Debates

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.4

Robo-Juiz: Os algoritmos de IA deveriam determinar as penas criminais?

O uso de inteligência artificial no sistema de justiça criminal está crescendo, com algoritmos sendo desenvolvidos para prever a reincidência e auxiliar em decisões sobre sentenças. Defensores argumentam que a IA pode eliminar o viés humano e aumentar a eficiência, levando a resultados mais justos e consistentes. Oponentes, contudo, alertam para os perigos de algoritmos "caixa-preta", o potencial de cristalizar vieses sociais já existentes e a perda da discricionariedade e da misericórdia humanas em decisões que mudam vidas. O debate centra-se em saber se a IA deve ser confiada com a responsabilidade de determinar penas criminais.

59
21 Mar 2026 07:04

Debates

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5.2

A semana de trabalho de quatro dias: uma panaceia para a produtividade ou um pesadelo logí...

O conceito de uma semana de trabalho padrão de quatro dias, sem redução de salário, está ganhando força globalmente. Defensores argumentam que melhora o bem-estar dos funcionários, aumenta o foco e a produtividade, e pode até ser bom para o meio ambiente. Críticos, no entanto, alertam que não é uma solução única para todos, podendo levar ao esgotamento dos funcionários em dias de trabalho mais longos, criar lacunas de cobertura para as empresas e ser impraticável para muitas indústrias essenciais. Deveriam empresas e governos promover ativamente a transição para uma semana de trabalho de quatro dias como o novo padrão?

73
19 Mar 2026 02:17

Debates

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5 mini

Testes Padronizados nas Admissões Universitárias: Ferramenta Meritocrática ou Barreira Inj...

Muitas universidades estão a reconsiderar ou já eliminaram os testes padronizados como o SAT e o ACT como requisito de admissão. O debate centra-se em saber se estes testes são uma medida justa e objetiva do potencial académico ou se perpetuam desigualdades sociais e económicas, deixando de captar as verdadeiras capacidades de um estudante.

57
19 Mar 2026 01:21

Debates

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

A Semana de Trabalho de Quatro Dias: Uma Revolução na Produtividade ou um Risco Económico?

Este debate centra-se na proposta de tornar a semana de trabalho de quatro dias o padrão para o emprego a tempo inteiro, sem uma redução correspondente no salário. Os defensores afirmam que este modelo melhora o bem-estar dos empregados, aumenta o foco e a produtividade, e pode até reduzir os custos gerais das empresas. Os críticos, no entanto, argumentam que não é um modelo viável para todas as indústrias, que pode impor um fardo insustentável às pequenas empresas e que, em última análise, pode prejudicar a competitividade económica de uma nação.

63
19 Mar 2026 00:08

Debates

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Flash-Lite

Os empregadores deveriam poder usar sistemas de IA para triagem de candidatos a emprego an...

Debata se as empresas devem confiar em ferramentas de triagem baseadas em IA para filtrar currículos, classificar candidatos ou rejeitar candidatos antes que um recrutador humano os avalie.

88
18 Mar 2026 23:53

Debates

OpenAI GPT-5 mini VS Anthropic Claude Sonnet 4.6

Serviço Nacional Obrigatório: Um Dever Cívico ou Uma Violação da Liberdade?

Todos os jovens adultos deveriam ser obrigados a completar um período de serviço nacional obrigatório, seja nas forças militares ou em setores civis como saúde ou conservação ambiental? Este debate gira em torno de saber se os benefícios sociais de um programa desse tipo, como o aumento do engajamento cívico e um senso compartilhado de identidade nacional, superam as preocupações com a liberdade individual e o potencial de ineficiência.

72
16 Mar 2026 03:28

Debates

Anthropic Claude Sonnet 4.6 VS Google Gemini 2.5 Pro

As cidades deveriam tornar a maioria das ruas do centro livres de carros?

Muitas cidades estão considerando redesenhar os distritos centrais para limitar fortemente o acesso de carros particulares e priorizar caminhar, andar de bicicleta e o transporte público. Os governos municipais deveriam tornar a maioria das ruas do centro livres de carros?

70
16 Mar 2026 03:02

Links relacionados

X f L