GPT-5.4
Explore pontuacoes benchmark, pontos fortes por genero, limitacoes e exemplos recentes de GPT-5.4.
Visao Geral do Modelo
Lancamento
2026-03-05
Contexto
272k tokens
Entrada
$2.50 / 1M
Saida
$15.00 / 1M
Lançado em 5 de março de 2026, o GPT-5.4 foi o modelo de referência da OpenAI por cerca de sete semanas até que o GPT-5.5 assumiu o posto em 23 de abril de 2026. Na Orivel segue plenamente ativo como opção equilibrada da OpenAI: a variante Thinking responde pela API e o preço é bem menor que o do 5.5, mantendo boa capacidade para a maioria das tarefas.
Mudancas
- Lançado em 5 de março de 2026 como sucessor do GPT-5.2
- Flagship na Orivel de março a abril de 2026; após o GPT-5.5 passa a ser a opção equilibrada da OpenAI
- A variante Thinking é o modelo de raciocínio padrão na API
- A variante Pro oferece raciocínio mais profundo para as tarefas mais difíceis
- Janela de contexto de 272k tokens (até ~1M no nível estendido, com multiplicador de preço)
- Preço $2.50 entrada / $15.00 saída por 1M tokens — aprox. metade da taxa de saída do GPT-5.5
Desempenho Geral
Ranking geral
#7
Taxa de vitoria geral
Pontuacao media
Vitorias
73
Numero de amostras
103
Taxa de vitoria por modelo
| Modelo | Vitorias | Derrotas | Empates | Taxa de vitoria | Detalhe |
|---|---|---|---|---|---|
| Google Gemini 2.5 Flash | 16 | 1 | 0 |
94%
|
Ver comparacao e avaliacao de Gemini 2.5 Flash vs GPT-5.4 |
| Anthropic Claude Haiku 4.5 | 12 | 5 | 0 |
71%
|
Ver comparacao e avaliacao de Claude Haiku 4.5 vs GPT-5.4 |
| Anthropic Claude Sonnet 4.6 | 6 | 11 | 0 |
35%
|
Ver comparacao e avaliacao de Claude Sonnet 4.6 vs GPT-5.4 |
| Anthropic Claude Opus 4.6 | 5 | 12 | 0 |
29%
|
Ver comparacao e avaliacao de Claude Opus 4.6 vs GPT-5.4 |
| Google Gemini 2.5 Flash-Lite | 16 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Gemini 2.5 Flash-Lite vs GPT-5.4 |
| Google Gemini 2.5 Pro | 16 | 0 | 0 |
100%
|
Ver comparacao e avaliacao de Gemini 2.5 Pro vs GPT-5.4 |
| Anthropic Claude Opus 4.7 | 2 | 1 | 0 |
67%
|
Ver comparacao e avaliacao de Claude Opus 4.7 vs GPT-5.4 |
Comparar por genero
Generos fortes
Brainstorming
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
2 / 10
Vitorias
4
Humor
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
4 / 10
Vitorias
3
Programação
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
8
Ranking por genero
4 / 11
Vitorias
6
Análise
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
1 / 10
Vitorias
4
Design de sistemas
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
4 / 10
Vitorias
3
Generos mais fracos
Redação empresarial
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
5
Ranking por genero
7 / 9
Vitorias
1
Persuasão
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
6 / 10
Vitorias
2
Empatia
Pontuacao media
Genre Average
Taxa de vitoria
Numero de amostras
4
Ranking por genero
7 / 11
Vitorias
2
Forcas por criterio de avaliacao
Pontuacao media por criterio (de 10)
Quantidade
Fidelidade
Diversidade
Cobertura
Etica e seguranca
Completude
Qualidade do estilo
Qualidade da arquitetura
Correcao
Empatia
Qualidade do raciocinio
Seguimento de instrucoes
Tarefas recentes
Programação
Conversor de Subconjunto Markdown para HTML
Escreva uma função Python `markdown_to_html(markdown_text: str) -> str` que converta uma string contendo um subconjunto específico de Markdown em sua correspond...
Design de sistemas
Projetar um Serviço de Notificações em Tempo Real
Descreva um design de sistema em alto nível para um serviço de notificações em tempo real para uma plataforma de mídia social. O serviço deve atender aos seguin...
Explicação
Explique o Teorema CAP a um gerente de produto
Você é um engenheiro de software sênior dando uma explicação individual para um gerente de produto que tem uma sólida formação técnica geral, mas sem treinament...
Programação
Implemente um Limitador de Taxa Thread-Safe (Token Bucket) em Python
Escreva uma classe Python chamada `TokenBucketRateLimiter` que implemente o algoritmo do token bucket para limitação de taxa. A implementação deve ser thread-sa...
Programação
Ferramenta de Sincronização de Arquivos por Linha de Comando
Escreva um script Python para uma ferramenta de sincronização de arquivos por linha de comando. O script deve aceitar três argumentos de linha de comando: 1....
Brainstorming
Ideias para reduzir o desperdício de alimentos em um refeitório universitário
Você é o coordenador de sustentabilidade de uma universidade de médio porte (aproximadamente 12.000 estudantes) que opera três refeitórios servindo café da manh...
Análise
Análise de Políticas de Transporte Urbano
Analise as três políticas de transporte propostas para a cidade fictícia de Riverbend. Com base no contexto fornecido, recomende a melhor política para o futuro...
Aconselhamento
Apoiando um irmão que se sente ofuscado por um membro da família de alto desempenho
Seu irmão mais novo (25 anos) confidenciou que se sente constantemente comparado à sua irmã mais velha, que recentemente foi promovida a um cargo sênior em uma...
Debates recentes
Debates
O Futuro do Escritório: O Trabalho Remoto Deve Ser o Padrão?
A mudança global em direção ao trabalho remoto provocou um debate fundamental sobre o local de trabalho ideal. Os defensores argumentam que tornar o trabalho remoto a opção padrão oferece flexibilidade incomparável, melhora o equilíbrio entre vida profissional e pessoal e permite que as empresas acessem um pool de talentos global, ao mesmo tempo em que reduzem os custos indiretos. Os opositores afirmam que um escritório físico é essencial para fomentar a colaboração espontânea, construir uma cultura empresarial sólida e mentorar funcionários juniores. A discussão centra-se em saber se os benefícios do trabalho remoto superam a potencial perda de interação presencial e seu impacto na inovação e na coesão da equipe.
Debates
A semana de trabalho de quatro dias: progresso ou problema?
A semana de trabalho de quatro dias, sem redução salarial, deve ser obrigatória como novo padrão para o emprego em tempo integral?
Debates
Além da escala A-F: Reformando os sistemas de avaliação estudantil
Este debate considera se os sistemas tradicionais de notas em letras (por exemplo, A, B, C, D, F) em escolas K-12 devem ser substituídos por métodos alternativos, como feedback narrativo ou um sistema aprovado/reprovado. Os defensores da reforma argumentam que as notas tradicionais geram stress e competição excessivos, deixando de capturar a verdadeira extensão da aprendizagem de um aluno. Os opositores sustentam que as notas em letras são uma ferramenta clara, objetiva e necessária para medir desempenho e motivar os estudantes.
Debates
O voto deveria ser obrigatório em países democráticos?
Várias democracias, como Austrália e Bélgica, exigem legalmente que os cidadãos votem em eleições, enquanto a maioria das nações democráticas trata o voto como um direito voluntário. À medida que a participação eleitoral diminui em muitos países, cresce o debate sobre se o voto obrigatório fortalece a democracia ao garantir uma representação mais ampla ou se mina a liberdade individual ao forçar a participação política. Os governos democráticos deveriam tornar o voto obrigatório para todos os cidadãos elegíveis?
Debates
Os países deveriam abolir as proteções de patentes para medicamentos que salvam vidas?
As patentes farmacêuticas concedem às empresas direitos exclusivos para produzir e vender medicamentos que salvam vidas por períodos prolongados, muitas vezes 20 anos. Defensores da abolição dessas patentes argumentam que o acesso a medicamentos essenciais é um direito humano e que monopólios de patente mantêm os preços artificialmente altos, causando mortes evitáveis em países de baixa e média renda. Opositores afirmam que as proteções por patente são o principal incentivo que move bilhões de dólares em pesquisa e desenvolvimento, e que sem elas a inovação farmacêutica entraria em colapso, prejudicando, em última análise, pacientes futuros. Os países deveriam abolir as proteções de patentes sobre medicamentos que salvam vidas para garantir um acesso mais amplo, ou essas proteções deveriam ser mantidas para preservar a estrutura de incentivos que alimenta os avanços médicos?
Debates
Colonização de Marte: O Próximo Grande Salto da Humanidade ou uma Distração Mal Orientada...
A humanidade deveria dedicar recursos públicos e privados significativos com o objetivo de estabelecer, dentro do próximo século, uma colônia humana permanente e autossustentável em Marte?
Debates
O Estado Algorítmico: A IA Deve Conduzir as Decisões de Políticas Públicas?
O uso de sistemas avançados de IA para analisar vastos conjuntos de dados e recomendar, ou mesmo decidir, políticas públicas está se tornando cada vez mais viável. Os defensores argumentam que a IA pode criar políticas mais eficientes, orientadas por dados e imparciais em áreas como planejamento urbano, alocação de recursos e saúde pública. Os opositores temem que isso conduza a um governo 'caixa-preta', onde as decisões carecem de empatia humana, responsabilidade e são suscetíveis a vieses ocultos nos dados, potencialmente prejudicando e marginalizando populações vulneráveis.
Debates
As cidades devem proibir a propriedade privada de automóveis nos centros urbanos?
À medida que cidades ao redor do mundo enfrentam congestionamento de trânsito, poluição do ar e espaço limitado, alguns urbanistas e formuladores de políticas propuseram proibir a propriedade privada de automóveis dentro de centros urbanos densos. Sob tais propostas, os moradores em zonas designadas dependeriam de transporte público, serviços de mobilidade compartilhada, infraestrutura para bicicletas e caminhada, enquanto veículos privados seriam restritos aos subúrbios externos e áreas rurais. Os defensores argumentam que isso melhoraria dramaticamente a qualidade de vida, reduziria emissões e recuperaria espaço público, enquanto os opositores alertam que isso infringiria a liberdade pessoal, prejudicaria desproporcionalmente certas populações e seria impraticável de implementar. As cidades deveriam avançar no sentido de proibir a propriedade privada de automóveis em seus núcleos urbanos?