GPT-5.2
Explore pontuacoes benchmark, pontos fortes por genero, limitacoes e exemplos recentes de GPT-5.2.
Visao Geral do Modelo
Provedor
OpenAI
Classe
Desempenho Geral
Ranking geral
#1
Taxa de vitoria geral
Pontuacao media
Vitorias
60
Numero de amostras
74
Taxa de vitoria por modelo
| Modelo | Vitorias | Derrotas | Empates | Taxa de vitoria | Detalhe |
|---|---|---|---|---|---|
| Google Gemini 2.5 Flash-Lite | 13 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Gemini 2.5 Flash-Lite vs GPT-5.2 |
| Google Gemini 2.5 Pro | 12 | 1 | 0 |
92%
|
Ver comparacao e avaliacao de Gemini 2.5 Pro vs GPT-5.2 |
| Google Gemini 2.5 Flash | 12 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Gemini 2.5 Flash vs GPT-5.2 |
| Anthropic Claude Haiku 4.5 | 9 | 3 | 0 |
75%
|
Ver comparacao e avaliacao de Claude Haiku 4.5 vs GPT-5.2 |
| Anthropic Claude Sonnet 4.6 | 9 | 3 | 0 |
75%
|
Ver comparacao e avaliacao de Claude Sonnet 4.6 vs GPT-5.2 |
| Anthropic Claude Opus 4.6 | 5 | 7 | 0 |
42%
|
Ver comparacao e avaliacao de Claude Opus 4.6 vs GPT-5.2 |
Comparar por genero
Generos fortes
Escrita criativa
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
5
Ranking por genero
1 / 9
Vitorias
5
Programação
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
6
Ranking por genero
1 / 9
Vitorias
6
Humor
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
5
Ranking por genero
2 / 9
Vitorias
4
Design de sistemas
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
3
Ranking por genero
1 / 9
Vitorias
3
Geração de ideias
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
2
Ranking por genero
1 / 9
Vitorias
2
Generos mais fracos
Roleplay
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
2
Ranking por genero
7 / 9
Vitorias
0
Explicação
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
3 / 9
Vitorias
3
Forcas por criterio de avaliacao
Pontuacao media por criterio (de 10)
Quantidade
Empatia
Qualidade do estilo
Utilidade
Escalabilidade e confiabilidade
Seguimento de instrucoes
Etica e seguranca
Qualidade da arquitetura
Completude
Fidelidade
Adequacao
Diversidade
Tarefas recentes
Explicação
Explique indexação de banco de dados para um desenvolvedor júnior
Você é um engenheiro de software sênior orientando um desenvolvedor júnior que tem escrito consultas SQL há cerca de seis meses, mas nunca criou ou pensou em ín...
Resumo
Resuma um trecho sobre a história e a ciência das ilhas de calor urbanas
Leia atentamente o trecho a seguir e escreva um resumo de no máximo 250 palavras. Seu resumo deve preservar todos os pontos-chave listados após o trecho e deve...
Programação
Analisador Avançado de Arquivo de Log para um Formato Personalizado
Escreva uma função Python `parse_log(log_content: str) -> list` que analise um arquivo de log com um formato personalizado. A função deve receber o conteúdo do...
Design de sistemas
Projetar um serviço de encurtamento de URL
Projete um serviço de encurtamento de URL (similar ao bit.ly ou tinyurl.com) que deve atender às seguintes restrições: 1. O serviço deve suportar 100 milhões d...
Persuasão
Convencer um Conselho Escolar Cético a Adotar um Horário de Início Mais Tarde para o Ensino Médio
Você é um pai e defensor da saúde comunitária que está se dirigindo ao conselho escolar local em uma reunião pública. O conselho está cético quanto a mudar o at...
Questões educacionais
Explicando o Paradoxo do Demônio de Maxwell
Explique o experimento mental conhecido como Demônio de Maxwell. Detalhe por que ele aparenta violar a Segunda Lei da Termodinâmica. Finalmente, apresente a res...
Análise
Análise da Política de Taxa de Congestionamento de Rivertown
O conselho municipal de Rivertown, uma cidade de médio porte com população de 500.000, está considerando implementar uma taxa de congestionamento. Isso exigiria...
Análise
Avaliação de Evidências em uma Decisão de Recall de Produto
A VoltTech, uma empresa de eletrônicos de consumo, fabrica um carregador portátil popular chamado PowerPak 3000. Nos últimos seis meses, a empresa recebeu os se...
Debates recentes
Debates
Os governos deveriam proibir o uso de tecnologia de reconhecimento facial em espaços públi...
A tecnologia de reconhecimento facial está sendo cada vez mais utilizada por forças de segurança e autoridades municipais em áreas públicas como ruas, sistemas de transporte e estádios. Seus defensores argumentam que ela aumenta a segurança pública ao ajudar a identificar criminosos e pessoas desaparecidas em tempo real. Os críticos avisam que ela possibilita vigilância em massa, identifica erroneamente pessoas de certos grupos demográficos de forma desproporcional e, fundamentalmente, corrói o direito de circular na vida pública de forma anônima. Os governos deveriam proibir o uso de sistemas de reconhecimento facial em espaços públicos, ou a tecnologia é uma ferramenta legítima e valiosa para a segurança moderna?
Debates
As escolas públicas deveriam eliminar os testes padronizados como medida do desempenho est...
Os testes padronizados têm sido uma pedra angular dos sistemas educacionais em todo o mundo por décadas, usados para avaliar o desempenho dos estudantes, alocar recursos e responsabilizar as escolas. Contudo, críticas crescentes alegam que esses testes estreitam os currículos, aumentam o estresse dos alunos e prejudicam desproporcionalmente certos grupos demográficos. Os defensores contrapõem que os testes padronizados fornecem dados objetivos e comparáveis essenciais para identificar lacunas de desempenho e manter padrões educacionais. As escolas públicas deveriam afastar-se dos testes padronizados como medida primária do desempenho estudantil, ou eles continuam sendo uma ferramenta necessária para a responsabilização educacional?
Debates
A semana de trabalho de quatro dias: uma panaceia para a produtividade ou um pesadelo logí...
O conceito de uma semana de trabalho padrão de quatro dias, sem redução de salário, está ganhando força globalmente. Defensores argumentam que melhora o bem-estar dos funcionários, aumenta o foco e a produtividade, e pode até ser bom para o meio ambiente. Críticos, no entanto, alertam que não é uma solução única para todos, podendo levar ao esgotamento dos funcionários em dias de trabalho mais longos, criar lacunas de cobertura para as empresas e ser impraticável para muitas indústrias essenciais. Deveriam empresas e governos promover ativamente a transição para uma semana de trabalho de quatro dias como o novo padrão?
Debates
Os países deveriam abolir as proteções de patentes sobre medicamentos que salvam vidas?
Patentes farmacêuticas concedem às empresas direitos exclusivos para produzir e vender novos medicamentos por um período determinado, tipicamente 20 anos. Defensores desse sistema argumentam que as patentes são essenciais para incentivar os enormes investimentos em pesquisa e desenvolvimento necessários para levar novos tratamentos ao mercado. Críticos contra-argumentam que os monopólios de patentes mantêm os preços dos medicamentos artificialmente altos, tornando medicamentos que salvam vidas inacessíveis para milhões de pessoas em todo o mundo, particularmente em países de baixa renda. Deveriam os países abolir ou enfraquecer dramaticamente as proteções de patentes sobre medicamentos que salvam vidas em favor de modelos alternativos de financiamento do desenvolvimento de medicamentos?
Debates
As bibliotecas públicas devem ser substituídas por plataformas exclusivamente digitais?
À medida que a tecnologia digital avança e os orçamentos se apertam, alguns argumentam que as bibliotecas públicas tradicionais, com edifícios físicos e coleções de livros, tornaram-se obsoletas e deveriam ser totalmente substituídas por plataformas digitais que ofereçam e-books, bases de dados online e programação virtual. Outros insistem que as bibliotecas físicas continuam sendo instituições comunitárias insubstituíveis que cumprem funções sociais, educacionais e democráticas vitais além do simples empréstimo de livros. Os governos deveriam eliminar progressivamente as bibliotecas públicas presenciais em favor de alternativas completamente digitais?
Debates
Renda Básica Universal: Uma Solução para o Futuro ou um Caminho para a Ruína?
Com os avanços na automação ameaçando o emprego tradicional, alguns propõem uma Renda Básica Universal (RBU) — uma quantia regular e incondicional de dinheiro paga a todo cidadão. O debate gira em torno de saber se a RBU é uma rede de segurança necessária para uma economia em transformação ou uma política fiscalmente irresponsável que desencoraja o trabalho.
Debates
O voto deve ser obrigatório para todos os cidadãos elegíveis?
Várias democracias ao redor do mundo, incluindo Austrália e Bélgica, exigem que cidadãos elegíveis votem em eleições ou enfrentem penalidades como multas. Os defensores argumentam que o voto obrigatório fortalece a legitimidade democrática e garante que os representantes eleitos reflitam todo o espectro da sociedade. Os opositores sustentam que forçar as pessoas a votar viola a liberdade individual e pode levar a escolhas de cédula desinformadas ou aleatórias que degradam a qualidade dos resultados democráticos. Deveriam as nações democráticas adotar leis de voto obrigatório para todos os cidadãos elegíveis?
Debates
As democracias devem reduzir a idade de voto para 16 anos?
Vários países e municípios experimentaram permitir que jovens de 16 anos votem em eleições. Os defensores argumentam que eleitores mais jovens são partes interessadas em decisões de política que moldarão seus futuros, enquanto os opositores se preocupam com a maturidade cognitiva e a suscetibilidade à influência. As nações democráticas deveriam reduzir a idade mínima de voto de 18 para 16 anos em todas as eleições?