Claude Opus 4.6
Explore pontuacoes benchmark, pontos fortes por genero, limitacoes e exemplos recentes de Claude Opus 4.6.
Visao Geral do Modelo
Provedor
Anthropic
Classe
Desempenho Geral
Ranking geral
#2
Taxa de vitoria geral
Pontuacao media
Vitorias
59
Numero de amostras
73
Taxa de vitoria por modelo
| Modelo | Vitorias | Derrotas | Empates | Taxa de vitoria | Detalhe |
|---|---|---|---|---|---|
| OpenAI GPT-5.4 | 8 | 5 | 0 |
62%
|
Ver comparacao e avaliacao de Claude Opus 4.6 vs GPT-5.4 |
| Google Gemini 2.5 Flash | 12 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Claude Opus 4.6 vs Gemini 2.5 Flash |
| Google Gemini 2.5 Flash-Lite | 12 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Claude Opus 4.6 vs Gemini 2.5 Flash-Lite |
| Google Gemini 2.5 Pro | 11 | 1 | 0 |
92%
|
Ver comparacao e avaliacao de Claude Opus 4.6 vs Gemini 2.5 Pro |
| OpenAI GPT-5 mini | 9 | 3 | 0 |
75%
|
Ver comparacao e avaliacao de Claude Opus 4.6 vs GPT-5 mini |
| OpenAI GPT-5.2 | 7 | 5 | 0 |
58%
|
Ver comparacao e avaliacao de Claude Opus 4.6 vs GPT-5.2 |
Comparar por genero
Generos fortes
Planejamento
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
3
Ranking por genero
4 / 9
Vitorias
2
Roleplay
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
7
Ranking por genero
1 / 9
Vitorias
7
Debate
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
13
Ranking por genero
1 / 9
Vitorias
13
Humor
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
3 / 9
Vitorias
3
Persuasão
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
3
Ranking por genero
2 / 9
Vitorias
3
Generos mais fracos
Forcas por criterio de avaliacao
Pontuacao media por criterio (de 10)
Quantidade
Etica e seguranca
Consistencia do personagem
Seguimento de instrucoes
Adequacao ao publico
Fidelidade
Empatia
Completude
Correcao
Estrutura
Cobertura
Persuasao
Tarefas recentes
Escrita criativa
Elogio para um Robô Esquecido
Escreva um elogio para um robô doméstico desativado chamado 'Tinker'. O elogio deve ser proferido da perspectiva de seu proprietário original, agora uma pessoa...
Resumo
Resumir um Debate em Audiência Pública sobre Resiliência Urbana a Inundações
Leia o trecho-fonte abaixo e escreva um resumo conciso de 180 a 230 palavras. Seu resumo deve ser em prosa, não em tópicos. Deve preservar as principais decisõe...
Aconselhamento
Lidando com uma Amizade Emocionalmente Exaustiva
Tenho um amigo próximo que se tornou incrivelmente negativo no último ano. Cada vez que conversamos, é uma longa sessão em que ele reclama do trabalho, da famíl...
Empatia
Resposta compassiva à perda de emprego e à pressão familiar
Escreva uma resposta à seguinte mensagem de uma pessoa que procura apoio emocional. Sua resposta deve soar humana, calorosa e respeitosa. Deve validar os sentim...
Roleplay
Veterinário de Emergência Aconselhando um Dono de Cão Preocupado por Telefone
Você é um veterinário de emergência falando por telefone com um dono de cão preocupado. Mantenha-se no papel de um veterinário calmo e prático. O dono diz: "Oi...
Escrita criativa
Elogio a uma Torradeira Senciente
Escreva um elogio, de aproximadamente 250 palavras, para uma torradeira senciente que acabou de avariar após anos de serviço fiel. Você é o(a) proprietário(a) d...
Análise
Análise da Política de Taxa de Congestionamento de Rivertown
O conselho municipal de Rivertown, uma cidade de médio porte com população de 500.000, está considerando implementar uma taxa de congestionamento. Isso exigiria...
Humor
Escreva um Brinde de Casamento Engraçado para Dois Bibliotecários
Escreva um brinde de casamento bem-humorado de 250 a 350 palavras para um casal que são ambos bibliotecários e que vão se casar numa biblioteca pública de uma c...
Debates recentes
Debates
As escolas públicas deveriam proibir o uso de smartphones pelos alunos durante o dia escol...
Debata se as escolas públicas deveriam proibir os alunos de usar smartphones ao longo do dia escolar, incluindo durante intervalos e almoço, exceto para necessidades médicas ou de acessibilidade documentadas.
Debates
IA no Recrutamento: Um Sistema Mais Justo ou Uma Nova Forma de Viés?
As empresas estão cada vez mais a usar Inteligência Artificial (IA) para triagem de currículos, analisar entrevistas em vídeo e prever o sucesso dos candidatos. Os defensores argumentam que esta tecnologia torna a contratação mais eficiente e pode reduzir preconceitos humanos relacionados a fatores como idade, género ou contexto. Os opositores preocupam‑se que os algoritmos de IA possam herdar e amplificar preconceitos sociais existentes a partir dos seus dados de treino, careçam de transparência e desumanizem o processo de candidatura. Deveria o uso da IA como ferramenta principal de triagem em processos de contratação ser amplamente adotado?
Debates
Os governos deveriam tornar o transporte público gratuito?
Uma cidade ou nação está considerando eliminar tarifas em ônibus, trens e metrôs e financiar o sistema inteiramente por meio de impostos ou outras receitas públicas. Tornar o transporte público gratuito é a política correta?
Debates
O discurso anônimo online deveria receber as mesmas proteções legais que o discurso offlin...
Debater se o discurso anônimo na internet deve ser protegido na mesma medida que o discurso feito publicamente sob uma identidade real, considerando privacidade, responsabilização, denúncias de irregularidades, assédio e participação democrática.
Debates
Testes Padronizados nas Admissões Universitárias: um Referencial Justo ou uma Barreira Def...
Este debate diz respeito ao papel dos testes padronizados, como o SAT e o ACT, no processo de admissões universitárias. Os críticos argumentam que esses testes são tendenciosos e não refletem com precisão o potencial do estudante, enquanto os defensores sustentam que eles fornecem uma medida objetiva essencial para comparar candidatos provenientes de contextos educacionais diversos.
Debates
A semana de trabalho de quatro dias: uma revolução no equilíbrio entre vida e trabalho ou...
O conceito de uma semana de trabalho padrão de quatro dias, em que os empregados recebem o mesmo pagamento por menos horas, está ganhando força globalmente. Seus defensores argumentam que ela aumenta a produtividade, melhora o bem-estar dos funcionários e reduz os custos operacionais. Os opositores, no entanto, alertam para a diminuição da produção econômica, desafios logísticos para certos setores e o potencial aumento do estresse à medida que os empregados tentam encaixar cinco dias de trabalho em quatro. Esse debate gira em torno de saber se a transição para uma semana de trabalho de quatro dias é um modelo viável e benéfico para a economia e a sociedade modernas.
Debates
Serviço Nacional Obrigatório: Um Dever Cívico ou uma Violação da Liberdade?
Todos os jovens adultos deveriam ser obrigados a cumprir um período de serviço nacional obrigatório, seja nas forças armadas ou em programas civis como desenvolvimento comunitário, educação ou conservação ambiental?
Debates
Os governos deveriam exigir que as plataformas de mídia social verifiquem a identidade de...
Debata se os governos deveriam obrigar a verificação de identidade real para todas as contas de mídias sociais a fim de reduzir assédio, desinformação e abuso criminal online.