GPT-5.5

Planejamento

Diferença +0.92

Pontuação média

Média do gênero

Taxa de vitória

Número de amostras

Ranking por gênero

2 / 13

Vitórias

Escrita criativa

Diferença +0.60

Pontuação média

Média do gênero

Taxa de vitória

Número de amostras

Ranking por gênero

4 / 15

Vitórias

Brainstorming

Diferença +0.52

Pontuação média

Média do gênero

Taxa de vitória

Número de amostras

Ranking por gênero

2 / 14

Vitórias

Análise

Diferença +0.40

Pontuação média

Média do gênero

Taxa de vitória

OpenAI GPT-5.5 VS Anthropic Claude Opus 5

Número de amostras

Ranking por gênero

3 / 15

Vitórias

Gêneros mais fracos

Redação empresarial

Diferença -0.59

Pontuação média

Média do gênero

Taxa de vitória

Número de amostras

Ranking por gênero

13 / 14

Vitórias

Gêneros mais fracos

Roleplay

Diferença -0.55

Pontuação média

Média do gênero

Taxa de vitória

Número de amostras

Ranking por gênero

12 / 14

Vitórias

Gêneros mais fracos

Persuasão

Diferença -0.39

Pontuação média

Média do gênero

Taxa de vitória

Número de amostras

Ranking por gênero

13 / 15

Vitórias

Gêneros mais fracos

Explicação

Diferença -0.09

Pontuação média

Média do gênero

Taxa de vitória

50%

Número de amostras

Ranking por gênero

9 / 14

Vitórias

Forças por critério de avaliação

Pontuação média por critério (de 10)

Quantidade

94 9 amostras

Segurança

92 12 amostras

Correção

91 21 amostras

Profundidade

91 3 amostras

Seguimento de instruções

90 24 amostras

Qualidade do estilo

90 3 amostras

Empatia

90 12 amostras

Completude

90 33 amostras

Utilidade

89 12 amostras

Diversidade

89 12 amostras

Especificidade

89 12 amostras

Qualidade da arquitetura

89 6 amostras

Tarefas recentes

Design de sistemas

Design de Sistema: Serviço de Notificações em Tempo Real

Você é um engenheiro de software sênior encarregado de projetar um sistema de notificações em tempo real para uma grande plataforma de mídia social. **Requisit...

25 Jul 2026 05:09

Empatia

OpenAI GPT-5.5 VS Anthropic Claude Sonnet 5

Resposta empática a um colega em dificuldades

Imagine que és um colega mentor de apoio. Um novo colega, Alex, envia‑te a seguinte mensagem. Escreve uma resposta para o Alex. A tua resposta deve ser empática...

25 Jul 2026 03:09

Brainstorming

OpenAI GPT-5.5 VS Anthropic Claude Fable 5

Brainstorming de Iniciativas de Agricultura Urbana Sustentável

Gere uma lista de pelo menos 10 iniciativas inovadoras e práticas para promover a agricultura urbana sustentável numa cidade de tamanho médio com espaço verde l...

154

08 Jul 2026 09:39

Redação empresarial

OpenAI GPT-5.5 VS Anthropic Claude Fable 5

Memorando Interno: Anúncio da Nova Política de Trabalho Híbrido

Você é o gerente do Departamento de Marketing de uma empresa de tecnologia chamada 'Innovate Inc.'. Sua empresa está mudando de um modelo de trabalho totalmente...

154

05 Jul 2026 09:38

Planejamento

OpenAI GPT-5.5 VS Anthropic Claude Fable 5

Planejar uma Festa no Jardim Comunitário

Você é o organizador principal de uma festa no jardim comunitário. Seu objetivo é realizar um evento bem-sucedido para aproximadamente 50 moradores do bairro da...

145

04 Jul 2026 09:41

Explicação

Google Gemini 2.5 Flash-Lite VS OpenAI GPT-5.5

Explique por que as vacinas podem causar febre para uma criança curiosa de 12 anos

Escreva uma explicação dirigida a uma criança curiosa de 12 anos que acabou de tomar uma vacina e está confusa sobre por que agora se sente com febre e cansada....

167

01 Jul 2026 09:41

Questões educacionais

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Problema de Física: A Distorção Temporal do Relógio de Avô

Um relógio de avô utiliza um pêndulo de latão para marcar o tempo, e ele está calibrado para ser perfeitamente preciso a uma temperatura ambiente de 20.0°C. Dur...

183

28 Jun 2026 09:40

Brainstorming

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Plano de Deslocamento Sustentável para uma Cidade de Médio Porte

Faça uma sessão de brainstorming de uma lista abrangente de soluções inovadoras e práticas para melhorar os deslocamentos ecológicos em uma cidade de médio port...

177

21 Jun 2026 09:39

Debates recentes

Debates

Anthropic Claude Opus 5 VS OpenAI GPT-5.5

O Futuro do Trabalho: A Semana de Trabalho de Quatro Dias

Este debate explora a viabilidade e a desejabilidade de implementar uma semana de trabalho de quatro dias padronizada (sem redução da remuneração) na maioria dos setores. Os proponentes defendem que isso aumenta a produtividade, o bem-estar dos trabalhadores e o equilíbrio entre vida profissional e pessoal, enquanto os opositores levantam preocupações sobre sua viabilidade económica, impacto no atendimento ao cliente e adequação a todos os setores.

25 Jul 2026 03:37

Debates

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Energia Nuclear: Uma Solução de Energia Limpa ou uma Aposta Radioativa?

À medida que o mundo lida com a necessidade urgente de transição dos combustíveis fósseis para combater as mudanças climáticas, a energia nuclear é frequentemente apresentada como uma alternativa poderosa e isenta de carbono. Este debate pesa os benefícios da energia nuclear como uma fonte de energia confiável e de alta produção contra os riscos significativos, incluindo o armazenamento de longo prazo de resíduos radioativos, o potencial para acidentes catastróficos como Chernobyl e Fukushima, e preocupações sobre a proliferação nuclear.

185

01 Jul 2026 14:41

Debates

O Direito de Reparo: Empoderar Consumidores ou Minar a Inovação?

O movimento 'Right to Repair' defende leis que exijam que os fabricantes forneçam aos consumidores e às oficinas de reparo independentes as peças, ferramentas e informações necessárias para consertar seus próprios dispositivos eletrônicos. Os apoiadores argumentam que isso reduz o lixo eletrônico, economiza dinheiro para os consumidores e promove uma economia mais sustentável. Os opositores, principalmente os fabricantes, sustentam que isso poderia comprometer a segurança dos dispositivos, a proteção de dados e sua propriedade intelectual, potencialmente sufocando a inovação.

188

25 Jun 2026 14:49

Debates

Colonização de Marte: o Próximo Grande Salto da Humanidade ou a Maior Distração da Terra?

Esta discussão explora se a humanidade deve investir recursos significativos para estabelecer uma colônia permanente e autossustentável em Marte. O debate pondera os potenciais benefícios de sobrevivência a longo prazo para a espécie contra os problemas imediatos e prementes na Terra que poderiam ser resolvidos com esses mesmos recursos.

224

15 Jun 2026 14:38

Debates

Testes padronizados nas escolas: uma medida justa de mérito ou uma barreira ultrapassada à...

Testes padronizados, como o SAT, o ACT e vários exames a nível estadual, têm sido durante muito tempo um pilar do sistema educativo, utilizados para avaliação de alunos, avaliação de escolas e admissão em universidades. Os defensores argumentam que proporcionam um referencial objetivo para medir o rendimento académico em populações diversas. No entanto, os críticos afirmam que esses testes são culturalmente tendenciosos, favorecem estudantes de origens privilegiadas e não conseguem captar as verdadeiras capacidades ou o potencial de um aluno, levando a pedidos de sua abolição em favor de métodos de avaliação mais holísticos. O debate centra-se em saber se os testes padronizados são uma ferramenta essencial para responsabilização e meritocracia ou um sistema discriminatório que perpetua a desigualdade.

305

03 Jun 2026 14:38

Debates

A semana de trabalho de quatro dias: uma revolução no equilíbrio entre vida profissional e...

O conceito de uma semana de trabalho padrão de quatro dias, sem redução salarial, está ganhando adesão em todo o mundo como uma forma de melhorar o bem-estar e a produtividade dos funcionários. O debate questiona se esse modelo é uma evolução sustentável e benéfica do ambiente de trabalho moderno ou um ideal impraticável que cria mais problemas do que resolve para as empresas e para a economia.

308

31 May 2026 14:38

Debates