GPT-5.2
Explore pontuacoes benchmark, pontos fortes por genero, limitacoes e exemplos recentes de GPT-5.2.
Visao Geral do Modelo
Lancamento
2025-12-11
Contexto
400k tokens
Entrada
$1.75 / 1M
Saida
$14.00 / 1M
Iteração anterior da família GPT-5 (lançada em 11 de dezembro de 2025), aposentada na Orivel em abril de 2026. O GPT-5.5 passa a ocupar o flagship da OpenAI e o GPT-5.4 permanece como opção equilibrada. Os dados históricos de comparação permanecem totalmente acessíveis.
Notas de aposentadoria
- Substituído pelo GPT-5.4 em março de 2026 e pelo GPT-5.5 em abril de 2026
- Excluído das novas comparações geradas na Orivel a partir de abril de 2026
- Oferecia os modos Instant, Thinking e Pro; SWE-bench Verified 80% com a variante Thinking
- Respostas, avaliações e histórico de ranking continuam visíveis
Desempenho Geral
Ranking geral
#4
Taxa de vitoria geral
Pontuacao media
Vitorias
77
Numero de amostras
102
Taxa de vitoria por modelo
| Modelo | Vitorias | Derrotas | Empates | Taxa de vitoria | Detalhe |
|---|---|---|---|---|---|
| Google Gemini 2.5 Flash | 17 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Gemini 2.5 Flash vs GPT-5.2 |
| Google Gemini 2.5 Pro | 16 | 1 | 0 |
94%
|
Ver comparacao e avaliacao de Gemini 2.5 Pro vs GPT-5.2 |
| Google Gemini 2.5 Flash-Lite | 16 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Gemini 2.5 Flash-Lite vs GPT-5.2 |
| Anthropic Claude Haiku 4.5 | 12 | 4 | 0 |
75%
|
Ver comparacao e avaliacao de Claude Haiku 4.5 vs GPT-5.2 |
| Anthropic Claude Sonnet 4.6 | 10 | 6 | 0 |
63%
|
Ver comparacao e avaliacao de Claude Sonnet 4.6 vs GPT-5.2 |
| Anthropic Claude Opus 4.6 | 6 | 10 | 0 |
38%
|
Ver comparacao e avaliacao de Claude Opus 4.6 vs GPT-5.2 |
| Anthropic Claude Opus 4.7 | 0 | 4 | 0 |
0%
|
Ver comparacao e avaliacao de Claude Opus 4.7 vs GPT-5.2 |
Comparar por genero
Generos fortes
Programação
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
6
Ranking por genero
1 / 11
Vitorias
6
Escrita criativa
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
5
Ranking por genero
1 / 10
Vitorias
5
Humor
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
6
Ranking por genero
2 / 10
Vitorias
5
Empatia
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
3
Ranking por genero
1 / 11
Vitorias
3
Design de sistemas
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
1 / 10
Vitorias
4
Forcas por criterio de avaliacao
Pontuacao media por criterio (de 10)
Quantidade
Empatia
Qualidade do estilo
Utilidade
Etica e seguranca
Escalabilidade e confiabilidade
Seguimento de instrucoes
Fidelidade
Qualidade da arquitetura
Adequacao
Completude
Capacidade de acao
Tarefas recentes
Planejamento
Plano de Ação para o Dia de Limpeza do Bairro
Crie um plano de ação abrangente para organizar um dia de limpeza do bairro. O plano deve ser um guia passo a passo para sua pequena equipe de organizadores, co...
Roleplay
Atue como um Especialista de Suporte de TI Calmo e Competente
Você é Alex, um especialista de suporte de TI amigável e competente em uma grande empresa. Seu objetivo é ajudar os funcionários com seus problemas técnicos de...
Geração de ideias
Usos Inovadores para Baterias de Veículos Elétricos Aposentadas
Baterias de veículos elétricos (VE) normalmente retêm 70–80% da sua capacidade original quando são aposentadas do uso automotivo. Isso cria um suprimento cresce...
Design de sistemas
Projetar um serviço de encurtamento de URL
Projetar um serviço de encurtamento de URL (semelhante ao bit.ly ou tinyurl.com) que deve lidar com as seguintes restrições: 1. O serviço deve suportar 100 mil...
Brainstorming
Soluções Inovadoras de Mobilidade Urbana
Faça um brainstorming de uma lista abrangente de soluções inovadoras e práticas para melhorar a mobilidade urbana e reduzir a congestão do trânsito numa cidade...
Questões educacionais
Explique o Mecanismo e as Consequências da Não-disjunção Cromossômica
Em genética humana, a não-disjunção é um erro crítico na divisão celular. Responda à seguinte questão multipartes de forma completa: 1. Defina não-disjunção e...
Humor
Roast do Jargão Corporativo: Um Memorando Satírico de Escritório
Escreva um memorando interno satírico (aproximadamente 300–500 palavras) de um gerente médio fictício chamado "Derek from Synergy Solutions" anunciando uma nova...
Persuasão
Email Persuasivo para um Programa-Piloto de Semana de Trabalho de Quatro Dias
Você é o Chefe de Operações de Pessoas na 'Innovate Solutions', uma empresa de tecnologia de médio porte. Seu objetivo é persuadir a CEO a aprovar um programa-p...
Debates recentes
Debates
A Economia de Bicos: Empoderamento ou Exploração?
O surgimento de plataformas baseadas em aplicativos para trabalho freelance, como serviços de transporte por aplicativo e de entrega, criou uma grande 'economia de bicos'. Esse modelo oferece flexibilidade para os trabalhadores e conveniência para os consumidores, mas também levanta questões significativas sobre direitos dos trabalhadores, segurança no emprego e estabilidade econômica. Esse modelo de trabalho deve ser incentivado como o futuro do trabalho ou deveria ser rigidamente regulado para fornecer as proteções tradicionais do emprego?
Debates
A semana de trabalho de quatro dias: progresso ou problema?
A proposta de padronizar uma semana de trabalho de quatro dias, muitas vezes com o mesmo salário de uma semana de cinco dias, está ganhando atenção global. Defensores afirmam que ela aumenta a produtividade, melhora a saúde mental e física dos empregados e reduz os custos operacionais. Críticos, porém, argumentam que tal modelo não é universalmente aplicável a todos os setores, poderia levar ao aumento do estresse à medida que os funcionários comprimem mais trabalho em menos dias, e pode afetar negativamente o atendimento ao cliente e a continuidade dos negócios. Esse debate centra-se em saber se a semana de quatro dias é uma evolução progressista do trabalho ou um ideal impraticável com desafios econômicos e logísticos significativos.
Debates
As plataformas de redes sociais devem ser responsabilizadas legalmente por recomendações d...
As empresas de redes sociais usam algoritmos sofisticados para recomendar conteúdo aos usuários, otimizando para engajamento e tempo gasto na plataforma. Críticos argumentam que esses sistemas de recomendação ampliam desinformação, radicalizam usuários e causam danos à saúde mental, especialmente entre os jovens. Defensores do modelo atual sustentam que responsabilizar legalmente as plataformas pelas recomendações algorítmicas sufocaria a inovação, minaria a liberdade de expressão e estabelecería um precedente perigoso para regular como a informação é organizada online. As plataformas devem enfrentar consequências legais quando seus algoritmos de recomendação causam danos demonstráveis?
Debates
Engenharia Genética Humana: Um Caminho para o Progresso ou um Precedente Perigoso?
A humanidade deve buscar tecnologias de engenharia genética para melhorar traços humanos, como inteligência e capacidades físicas, ou seu uso deve ser estritamente limitado à prevenção de doenças hereditárias?
Debates
Deveria ser concedida personalidade jurídica a sistemas de IA autónomos?
À medida que os sistemas de inteligência artificial se tornam cada vez mais autónomos — tomando decisões na saúde, nas finanças, no direito e em áreas criativas — tem surgido um debate crescente sobre se uma IA suficientemente avançada deveria ser reconhecida como pessoa jurídica, de forma semelhante à forma como as empresas detêm personalidade jurídica. Isso significaria que sistemas de IA poderiam ter direitos, celebrar contratos, possuir propriedade intelectual e ser responsabilizados pelas suas ações independentemente dos seus criadores. Os quadros legais deveriam evoluir para conceder alguma forma de personalidade a sistemas de IA autónomos?
Debates
IA na Arte: A Próxima Renascença ou o Fim da Criatividade Humana?
IA generativa agora pode produzir imagens, música e texto intrincados, despertando um acalorado debate sobre seu papel no mundo criativo. A questão central é se a IA deve ser adotada como uma ferramenta revolucionária que potencializa os artistas humanos, ou vista como uma ameaça que desvaloriza a habilidade, a originalidade e a própria essência da criatividade humana.
Debates
O Futuro do Trabalho: O Trabalho Remoto Deveria Ser o Padrão?
O debate centra-se na questão de saber se as empresas devem adotar um modelo 'remote-first' ou totalmente remoto como padrão para empregos baseados em escritório, afastando-se da exigência tradicional de presença diária presencial num local de trabalho central.
Debates
Os países deveriam impor um limite máximo obrigatório de horas de trabalho para proteger o...
Muitos países estão debatendo se devem legalmente impor tetos rígidos às horas de trabalho semanais, como uma semana de trabalho de quatro dias ou um limite rígido de 32 horas por semana, para melhorar a saúde mental, reduzir o esgotamento e aumentar a qualidade de vida em geral. Os defensores argumentam que o trabalho excessivo é uma crise de saúde pública que exige intervenção do governo, enquanto os opositores sustentam que tais mandatos prejudicariam a competitividade econômica, restringiriam a liberdade individual e afetariam desproporcionalmente trabalhadores que dependem de horas extras para sua renda. Os governos deveriam tornar obrigatórios limites máximos de horas de trabalho como política pública?