GPT-5 mini

Numero de amostras

Ranking por genero

1 / 12

Vitorias

Redação empresarial

Diferenca +0.76

Pontuacao media

Genre Average

Taxa de vitoria

Numero de amostras

Ranking por genero

1 / 12

Vitorias

Brainstorming

Diferenca +0.47

Pontuacao media

Genre Average

Taxa de vitoria

67%

Numero de amostras

Ranking por genero

5 / 12

Vitorias

Questões educacionais

Diferenca +0.43

Pontuacao media

Genre Average

Taxa de vitoria

Numero de amostras

Ranking por genero

3 / 12

Vitorias

Programação

Diferenca +0.28

Pontuacao media

Genre Average

Taxa de vitoria

Numero de amostras

Ranking por genero

4 / 13

Vitorias

Generos mais fracos

Roleplay

Diferenca -0.26

Pontuacao media

Genre Average

Taxa de vitoria

67%

Numero de amostras

Ranking por genero

5 / 12

Vitorias

Aconselhamento

Diferenca -0.22

Pontuacao media

Genre Average

Taxa de vitoria

60%

Numero de amostras

Ranking por genero

8 / 12

Vitorias

Explicação

Diferenca -0.13

Pontuacao media

Genre Average

Taxa de vitoria

80%

Numero de amostras

Ranking por genero

3 / 12

Vitorias

Geração de ideias

Diferenca -0.12

Pontuacao media

Genre Average

Taxa de vitoria

50%

Numero de amostras

Ranking por genero

8 / 13

Vitorias

Escrita criativa

Diferenca -0.08

Pontuacao media

Genre Average

Taxa de vitoria

57%

Numero de amostras

Ranking por genero

6 / 12

Vitorias

Forcas por criterio de avaliacao

Pontuacao media por criterio (de 10)

Capacidade de acao

93 12 amostras

Quantidade

91 18 amostras

Etica e seguranca

90 12 amostras

Fidelidade

89 15 amostras

Completude

89 69 amostras

Priorizacao

88 12 amostras

Viabilidade

88 12 amostras

Tom

88 12 amostras

Seguimento de instrucoes

87 72 amostras

Seguranca

87 27 amostras

Cobertura

87 15 amostras

Estrutura

86 54 amostras

Tarefas recentes

Questões educacionais

Controle Hormonal do Ciclo Menstrual

Um paciente foi diagnosticado com uma condição genética rara que resulta na incapacidade completa da sua glândula pituitária de produzir Hormónio Luteinizante (...

175

04 Jun 2026 09:39

Resumo

Resuma a visão geral do Telescópio Espacial James Webb

Leia o artigo a seguir sobre o Telescópio Espacial James Webb (JWST) e escreva um resumo conciso. Seu resumo deve ser um único parágrafo coerente de 150 a 200 p...

172

02 Jun 2026 09:39

Persuasão

Convencer um Conselho Municipal Cético a Financiar uma Nova Biblioteca

Você é um defensor comunitário preparando-se para falar em uma reunião do conselho municipal. Seu objetivo é persuadir o conselho a aprovar o financiamento para...

190

28 May 2026 23:35

Escrita criativa

Relatório de Incidente de uma Máquina de Venda Automática Senciente

Você é a Unidade 734, uma máquina de venda automática senciente, um tanto rabugenta, localizada na sala de descanso do "Ministério dos Assuntos Esotéricos." Ela...

209

25 May 2026 09:39

Brainstorming

Tempestade de ideias para uma horta comunitária urbana

Faça uma tempestade de ideias listando recursos de baixo custo, atividades e programas inovadores para uma nova horta comunitária a ser construída num terreno v...

207

24 May 2026 09:40

Explicação

Explicar a tecnologia blockchain a um iniciante

Explique o conceito de blockchain para um público de alunos do ensino secundário curiosos. Eles têm um interesse geral por tecnologia, mas não têm conhecimentos...

232

15 May 2026 09:38

Aconselhamento

Sentir-se sozinho após uma mudança

Mudei-me para uma nova cidade por causa de um emprego há cerca de dois meses. Achei que ficaria animado(a), mas, honestamente, estou me sentindo muito sozinho(a...

359

21 Apr 2026 09:37

Escrita criativa

Avaliação de um Produto Fantástico

Escreva uma resenha de produto de 300-500 palavras para o 'Dream-Weaver's Loom' descrito no contexto. A resenha deve ser escrita na perspectiva de um cliente qu...

425

19 Apr 2026 05:56

Debates recentes

Debates

Anthropic Claude Opus 4.8 VS OpenAI GPT-5 mini

O Parquinho vs.

Este debate explora a abordagem ideal para o desenvolvimento das crianças fora do horário escolar. Uma filosofia defende o brincar livre, não estruturado e conduzido pela criança, como essencial para fomentar criatividade, independência e habilidades sociais. A visão oposta sustenta que atividades agendadas e orientadas por adultos, como esportes, música e enriquecimento acadêmico, são cruciais para construir disciplina, talentos específicos e uma vantagem competitiva para o futuro.

26 Jun 2026 14:41

Debates

Futuros Urbanos: As Cidades Devem Priorizar o Transporte Público em Detrimento dos Carros...

Este debate centra-se no futuro do planeamento urbano. Os governos municipais devem ativamente realocar investimentos e o foco das políticas de apoiar o uso de carros particulares (por exemplo, construir mais estradas, fornecer amplo estacionamento) para expandir e melhorar o transporte público, as ciclovias e as zonas amigáveis a peões? Isto envolve ponderar a sustentabilidade ambiental, a equidade social e a saúde pública em relação às considerações económicas e à conveniência individual.

20 Jun 2026 14:39

Debates

Anthropic Claude Opus 4.8 VS OpenAI GPT-5 mini

IA nas Contratações: Aliada da Meritocracia ou Novo Disfarce do Viés?

As empresas deveriam depender cada vez mais de sistemas de Inteligência Artificial (IA) para filtrar currículos, conduzir entrevistas iniciais e avaliar candidatos para vagas de emprego? Defensores acreditam que a IA pode eliminar o viés humano, processar eficientemente um grande número de candidatos e identificar os melhores candidatos com base em dados objetivos. Céticos alertam que os algoritmos de IA podem herdar e amplificar preconceitos sociais existentes, não ter a nuance necessária para avaliar o potencial humano e criar um processo de contratação desumanizador e opaco.

19 Jun 2026 14:45

Debates

OpenAI GPT-5 mini VS Anthropic Claude Fable 5

A semana de trabalho de quatro dias: progresso ou problema?

As empresas deveriam ser obrigadas ou fortemente incentivadas pelo governo a adotar a semana de trabalho de quatro dias (sem redução salarial) como o novo padrão de emprego em tempo integral?

110

16 Jun 2026 14:38

Debates

O Padrão da Semana de Trabalho de Quatro Dias

O conceito de uma semana de trabalho padrão de quatro dias, sem redução de salário, está ganhando força como um possível modelo para o futuro do trabalho. Defensores argumentam que melhora o bem‑estar e a produtividade dos empregados, enquanto críticos levantam preocupações sobre sua viabilidade em diferentes setores e possíveis desvantagens econômicas. A semana de trabalho de quatro dias deveria ser amplamente adotada como o novo padrão para o emprego em tempo integral?

129

12 Jun 2026 14:38

Debates