Claude Opus 4.7
Explore pontuacoes benchmark, pontos fortes por genero, limitacoes e exemplos recentes de Claude Opus 4.7.
Visao Geral do Modelo
Lancamento
2026-04-16
Contexto
1M tokens
Entrada
$5.00 / 1M
Saida
$25.00 / 1M
Claude Opus 4.7 é o modelo de referência atual da Anthropic, disponível em GA desde 16 de abril de 2026. A Anthropic o posiciona como seu modelo mais capaz para raciocínio complexo, trabalho agente de longo alcance e engenharia de software de fronteira.
A mudança mais notável em relação ao Opus 4.6 é um salto de qualidade em programação agente — hoje é possível delegar com confiança as tarefas de código mais difíceis. A visão melhora bastante, com entrada de imagens em alta resolução, e os resultados criativos (interfaces, slides, documentos) voltam mais refinados e com melhor gosto estético.
Inclui um novo tokenizador, janela de contexto de 1M tokens, até 128k tokens de saída na Messages API e Adaptive thinking, que decide quando raciocinar com mais profundidade. O preço permanece igual ao do Opus 4.6 ($5 entrada / $25 saída por 1M tokens) e o corte de conhecimento é janeiro de 2026.
Mudancas
- Salto de qualidade em programação agente — melhor em engenharia de software de longo alcance e múltiplos arquivos
- Visão bastante melhor, com entrada de imagens em alta resolução
- Resultados criativos mais refinados em interfaces, slides e documentos
- Novo tokenizador; contexto de 1M tokens e até 128k tokens de saída na Messages API
- Até 300k tokens de saída na Message Batches API via cabeçalho beta `output-300k-2026-03-24`
- Adaptive thinking: o modelo decide quando raciocinar passo a passo
- Preço idêntico ao Opus 4.6: $5 entrada / $25 saída por 1M tokens
- Disponível no Claude API, Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry
- Corte de conhecimento e dados de treinamento: janeiro de 2026
Desempenho Geral
Ranking geral
#1
Taxa de vitoria geral
Pontuacao media
Vitorias
19
Numero de amostras
21
Taxa de vitoria por modelo
| Modelo | Vitorias | Derrotas | Empates | Taxa de vitoria | Detalhe |
|---|---|---|---|---|---|
| OpenAI GPT-5.2 | 4 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Claude Opus 4.7 vs GPT-5.2 |
| OpenAI GPT-5 mini | 3 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Claude Opus 4.7 vs GPT-5 mini |
| Google Gemini 2.5 Flash | 3 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Claude Opus 4.7 vs Gemini 2.5 Flash |
| Google Gemini 2.5 Flash-Lite | 3 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Claude Opus 4.7 vs Gemini 2.5 Flash-Lite |
| Google Gemini 2.5 Pro | 3 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Claude Opus 4.7 vs Gemini 2.5 Pro |
| OpenAI GPT-5.4 | 1 | 2 | 0 |
33%
|
Ver comparacao e avaliacao de Claude Opus 4.7 vs GPT-5.4 |
| OpenAI GPT-5.5 | 2 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Claude Opus 4.7 vs GPT-5.5 |
Comparar por genero
Generos fortes
Planejamento
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
1
Ranking por genero
1 / 10
Vitorias
1
Questões educacionais
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
1
Ranking por genero
1 / 10
Vitorias
1
Escrita criativa
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
1
Ranking por genero
2 / 10
Vitorias
1
Roleplay
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
2
Ranking por genero
2 / 11
Vitorias
2
Debate
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
10
Ranking por genero
2 / 11
Vitorias
9
Forcas por criterio de avaliacao
Pontuacao media por criterio (de 10)
Empatia
Seguranca
Consistencia do personagem
Qualidade do estilo
Especificidade
Priorizacao
Adequacao ao publico
Fidelidade
Qualidade do raciocinio
Seguimento de instrucoes
Adequacao
Viabilidade
Tarefas recentes
Roleplay
Conselho do Detetive Noir sobre Ser Seguido
Você é o Detetive Miles Corrigan, um investigador particular saído diretamente de um filme noir dos anos 1940. Seu escritório está fracamente iluminado, cheira...
Questões educacionais
Analise por que um produto não é um polinômio
Um estudante afirma que, porque f(x) = (x^2 - 1)/(x - 1) se simplifica para x + 1 quando x ≠ 1, a função g(x) = ((x^2 - 1)/(x - 1)) · |x - 1| é um polinômio igu...
Empatia
Responder a um amigo sobrecarregado por cuidados e trabalho
Um amigo lhe envia esta mensagem: "Sinto que estou falhando em tudo. A saúde do meu pai piorou, estou perdendo prazos no trabalho, e toda vez que alguém pergunt...
Programação
Conversor de Subconjunto Markdown para HTML
Escreva uma função Python `markdown_to_html(markdown_text: str) -> str` que converta uma string contendo um subconjunto específico de Markdown em sua correspond...
Aconselhamento
Sentir-se sozinho após uma mudança
Mudei-me para uma nova cidade por causa de um emprego há cerca de dois meses. Achei que ficaria animado(a), mas, honestamente, estou me sentindo muito sozinho(a...
Resumo
Resuma uma audiência da Câmara Municipal sobre um Plano de Resiliência ao Calor
Leia a seguinte passagem-fonte e escreva um resumo conciso dela em 180 a 230 palavras. Seu resumo deve ser neutro no tom, escrito como um único ensaio coerente...
Persuasão
Convencer um Conselho Municipal Cético a Implementar um Programa-Piloto de Ruas Escolares sem Carros
Escreva um discurso persuasivo para um conselho municipal que está decidindo se aprova um programa-piloto de seis meses para criar zonas sem carros nas ruas dir...
Planejamento
Plano de Ação para o Dia de Limpeza do Bairro
Crie um plano de ação abrangente para organizar um dia de limpeza do bairro. O plano deve ser um guia passo a passo para sua pequena equipe de organizadores, co...
Debates recentes
Debates
Renda Básica Universal (RBU)
Os governos devem implementar uma Renda Básica Universal (RBU), fornecendo uma quantia regular e incondicional de dinheiro a todos os cidadãos, independentemente de sua situação de emprego?
Debates
A Economia de Bicos: Empoderamento ou Exploração?
O surgimento de plataformas baseadas em aplicativos para trabalho freelance, como serviços de transporte por aplicativo e de entrega, criou uma grande 'economia de bicos'. Esse modelo oferece flexibilidade para os trabalhadores e conveniência para os consumidores, mas também levanta questões significativas sobre direitos dos trabalhadores, segurança no emprego e estabilidade econômica. Esse modelo de trabalho deve ser incentivado como o futuro do trabalho ou deveria ser rigidamente regulado para fornecer as proteções tradicionais do emprego?
Debates
Os governos deveriam exigir que as plataformas de redes sociais verifiquem a identidade de...
Debata se os governos devem exigir a verificação da identidade real para todas as contas em redes sociais, com o objetivo de reduzir o assédio, a fraude e a desinformação.
Debates
A semana de trabalho de quatro dias: progresso ou problema?
A proposta de padronizar uma semana de trabalho de quatro dias, muitas vezes com o mesmo salário de uma semana de cinco dias, está ganhando atenção global. Defensores afirmam que ela aumenta a produtividade, melhora a saúde mental e física dos empregados e reduz os custos operacionais. Críticos, porém, argumentam que tal modelo não é universalmente aplicável a todos os setores, poderia levar ao aumento do estresse à medida que os funcionários comprimem mais trabalho em menos dias, e pode afetar negativamente o atendimento ao cliente e a continuidade dos negócios. Esse debate centra-se em saber se a semana de quatro dias é uma evolução progressista do trabalho ou um ideal impraticável com desafios econômicos e logísticos significativos.
Debates
O Futuro do Escritório: O Trabalho Remoto Deve Ser o Padrão?
A mudança global em direção ao trabalho remoto provocou um debate fundamental sobre o local de trabalho ideal. Os defensores argumentam que tornar o trabalho remoto a opção padrão oferece flexibilidade incomparável, melhora o equilíbrio entre vida profissional e pessoal e permite que as empresas acessem um pool de talentos global, ao mesmo tempo em que reduzem os custos indiretos. Os opositores afirmam que um escritório físico é essencial para fomentar a colaboração espontânea, construir uma cultura empresarial sólida e mentorar funcionários juniores. A discussão centra-se em saber se os benefícios do trabalho remoto superam a potencial perda de interação presencial e seu impacto na inovação e na coesão da equipe.
Debates
As escolas devem proibir os alunos de usar IA generativa em trabalhos avaliados?
Debater se as escolas primárias e secundárias devem proibir o uso, por alunos, de ferramentas de IA generativa em trabalhos e redações avaliados, exceto em casos de acessibilidade definidos de forma restrita.
Debates
O Padrão da Semana de Trabalho de Quatro Dias
Esta discussão explora a proposta de tornar a semana de trabalho de quatro dias o padrão para o emprego em tempo integral, sem redução salarial. Os defensores argumentam que isso aumenta a produtividade, melhora o bem‑estar dos funcionários e beneficia a economia. Os opositores levantam preocupações sobre sua viabilidade em todos os setores, o potencial aumento do estresse para encaixar o trabalho em menos dias e os impactos negativos no atendimento ao cliente e nas operações comerciais.
Debates
Deveriam os governos exigir que as plataformas de redes sociais verifiquem as identidades...
Debata se os governos devem obrigar a verificação de identidade real para cada conta em redes sociais, mesmo que as plataformas ainda permitam pseudónimos públicos.