GPT-5 mini
Explora puntuaciones benchmark, fortalezas por genero, debilidades y ejemplos recientes de GPT-5 mini.
Resumen del Modelo
Publicado
2025-08-07
Contexto
400k tokens
Entrada
$0.25 / 1M
Salida
$2.00 / 1M
La variante compacta de la familia GPT-5, diseñada para cargas sensibles a la latencia y de alto volumen, manteniendo el estilo de razonamiento de GPT-5.
Cambios
- Lanzado junto con GPT-5 en agosto de 2025
- Optimizado para baja latencia y coste reducido por token
- Precio: $0.25 entrada / $2.00 salida por 1M tokens
- Apto para pipelines de alto rendimiento, razonamiento ligero y traducción
- Orivel lo utiliza para traducciones a nivel de título
Rendimiento General
Ranking general
#6
Tasa de victoria global
Puntuacion media
Victorias
72
Muestras
101
Tasa de victoria por modelo
Comparar por genero
Generos fuertes
Planificación
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
3 / 11
Victorias
4
Redacción empresarial
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
1 / 9
Victorias
4
Lluvia de ideas
Puntuacion media
Genre Average
Tasa de victoria
Muestras
5
Ranking por genero
4 / 10
Victorias
4
Preguntas educativas
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
3 / 11
Victorias
4
Programación
Puntuacion media
Genre Average
Tasa de victoria
Muestras
5
Ranking por genero
3 / 11
Victorias
5
Generos mas flojos
Juego de roles
Puntuacion media
Genre Average
Tasa de victoria
Muestras
3
Ranking por genero
4 / 11
Victorias
2
Acompañamiento
Puntuacion media
Genre Average
Tasa de victoria
Muestras
5
Ranking por genero
7 / 11
Victorias
3
Generación de ideas
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
7 / 11
Victorias
2
Empatía
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
8 / 11
Victorias
1
Explicación
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
1 / 9
Victorias
4
Fortalezas por criterio de evaluacion
Puntuacion media por criterio (sobre 10)
Cantidad
Capacidad de accion
Etica y seguridad
Integridad
Fidelidad
Priorizacion
Viabilidad
Tono
Seguimiento de instrucciones
Seguridad
Estructura
Cobertura
Tareas recientes
Acompañamiento
Sentirse solo después de una mudanza
Me mudé a una nueva ciudad por trabajo hace aproximadamente dos meses. Pensé que estaría emocionado, pero sinceramente, me siento realmente solo. No conozco a n...
Escritura creativa
Reseña de un producto fantástico
Escribe una reseña de producto de 300-500 palabras para el 'Dream-Weaver's Loom' descrito en el contexto. La reseña debe estar escrita desde la perspectiva de u...
Explicación
Explica el teorema CAP a un gerente de producto
Eres un arquitecto de software sénior que se reúne con un gerente de producto que tiene una comprensión general sólida de la tecnología pero no tiene formación...
Resumen
Resume la historia y el impacto de la imprenta
Lee el texto proporcionado sobre la historia de la imprenta. Escribe un resumen del texto en un solo párrafo coherente. Tu resumen debe tener entre 150 y 200 pa...
Preguntas educativas
Bucles de retroalimentación hormonal en el ciclo menstrual humano
Explique el control hormonal del ciclo menstrual humano, centrándose en las fases folicular y lútea. Su explicación debe detallar los roles de la Hormona libera...
Lluvia de ideas
Usos creativos para contenedores de envío retirados
Un pequeño pueblo costero (población ~5,000) ha adquirido 20 contenedores de acero fuera de servicio (unidades estándar de 40 pies) sin costo. El ayuntamiento q...
Humor
Escribe un monólogo de stand-up sobre las absurdidades de hacer la compra
Escribe un breve monólogo de stand-up (aproximadamente 400–600 palabras) interpretado por un comediante ficticio en una noche de micrófono abierto. Todo el núme...
Redacción empresarial
Memorando interno que explica un nuevo proceso de informes de ventas
Eres el Jefe de Operaciones de Ventas en una empresa tecnológica de tamaño medio. Para mejorar la precisión de los datos y la colaboración del equipo, estás imp...
Debates recientes
Debates
El estándar de la semana laboral de cuatro días
Esta discusión explora la propuesta de hacer que la semana laboral de cuatro días sea el estándar para el empleo a tiempo completo, sin reducción de salario. Los partidarios sostienen que aumenta la productividad, mejora el bienestar de los empleados y beneficia a la economía. Los opositores plantean dudas sobre su viabilidad en todas las industrias, el potencial aumento del estrés por tener que concentrar el trabajo en menos días y los impactos negativos en el servicio al cliente y en las operaciones empresariales.
Debates
¿Deberían los países imponer un impuesto sobre la riqueza a las personas con patrimonio ne...
A medida que la desigualdad económica sigue ampliándose en muchas naciones, algunos responsables políticos y economistas abogan por un impuesto anual sobre la riqueza dirigido a individuos cuyo patrimonio neto total supere un umbral elevado, como cincuenta millones de dólares. A diferencia de los impuestos sobre la renta, un impuesto sobre la riqueza se aplicaría a los activos acumulados, incluyendo acciones, bienes raíces y otras tenencias. Sus defensores sostienen que podría financiar servicios públicos y reducir peligrosas concentraciones de poder económico, mientras que los críticos advierten que podría provocar fuga de capitales, resultar administrativamente impracticable y, en última instancia, perjudicar el crecimiento económico. ¿Deberían los países adoptar un impuesto anual sobre la riqueza personal extrema?
Debates
¿Deberían los gobiernos prohibir el uso de tecnología de reconocimiento facial en espacios...
La tecnología de reconocimiento facial se está desplegando cada vez más por las fuerzas del orden y las autoridades municipales en espacios públicos como calles, estaciones de transporte y estadios. Los partidarios sostienen que mejora la seguridad pública al ayudar a identificar criminales y personas desaparecidas en tiempo real. Los críticos advierten que facilita la vigilancia masiva, identifica erróneamente de manera desproporcionada a las personas de color y erosiona fundamentalmente el derecho al anonimato en la vida pública. ¿Deberían los gobiernos prohibir el uso de sistemas de reconocimiento facial en espacios públicos, o deberían permitir y regular su despliegue?
Debates
¿Deben los hallazgos de la investigación científica ser obligatoriamente de acceso abierto...
La investigación científica financiada públicamente y privadamente se publica actualmente en gran medida tras muros de pago mantenidos por revistas académicas. Algunos argumentan que todos los hallazgos de investigación deberían ponerse a disposición de forma gratuita e inmediata para todo el mundo en el momento de la publicación, mientras que otros sostienen que el modelo actual de suscripción y muros de pago es necesario para sostener la revisión por pares de calidad, la infraestructura editorial y la viabilidad financiera de la publicación científica. Este debate toca la propiedad intelectual, el ritmo de la innovación, la equidad en el acceso global al conocimiento y la economía de la información.
Debates
Supervisión digital: ¿Es la monitorización de la productividad de los empleados una herram...
Muchas empresas están adoptando software que rastrea la actividad de los empleados, como pulsaciones de teclas, movimientos del ratón, sitios web visitados y tiempo dedicado a aplicaciones específicas. El debate se centra en si esta práctica es una forma legítima de garantizar la productividad y gestionar equipos remotos, o si constituye una invasión de la privacidad que erosiona la confianza y la moral.
Debates
¿Deberían las ciudades prohibir la propiedad privada de automóviles en los centros urbanos...
A medida que las ciudades de todo el mundo afrontan la congestión del tráfico, la contaminación del aire y el espacio limitado, algunos urbanistas y responsables de políticas han propuesto prohibir la propiedad privada de automóviles dentro de los centros urbanos densos. Según tales propuestas, los residentes en zonas designadas dependerían totalmente de redes de transporte público ampliadas, programas de bicicletas compartidas, servicios de transporte bajo demanda y cooperativas de coches compartidos. Los partidarios sostienen que esto reduciría drásticamente las emisiones, liberaría terrenos actualmente utilizados para el estacionamiento y mejoraría la calidad de vida. Los opositores se preocupan por los impactos en la libertad personal, la accesibilidad para residentes con discapacidades y personas mayores, la disrupción económica y si las alternativas públicas pueden realmente satisfacer las diversas necesidades de transporte de una ciudad moderna. ¿Deberían los gobiernos perseguir tales prohibiciones, o la propiedad privada de automóviles sigue siendo un derecho fundamental que las ciudades deben acomodar?
Debates
Policiamiento predictivo: ¿Una herramienta para la seguridad pública o un catalizador de s...
El debate se centra en el uso de algoritmos de IA por parte de las agencias de seguridad para prever la actividad criminal. Estos sistemas analizan datos históricos de delitos para identificar zonas o individuos de alto riesgo, con el objetivo de prevenir el crimen antes de que ocurra. El conflicto central es si esta tecnología es una herramienta legítima para mejorar la seguridad pública o un instrumento que refuerza y automatiza los sesgos sociales.
Debates
IA en la gobernanza: ¿Decisiones basadas en datos o declive democrático?
¿Se debería otorgar a los sistemas de inteligencia artificial una autoridad significativa para tomar decisiones importantes de política pública, como asignar presupuestos municipales, planificar infraestructuras o administrar servicios sociales? Este debate sopesa el potencial de eficiencia e imparcialidad impulsadas por datos frente a los riesgos de sesgos algorítmicos, falta de responsabilidad y la erosión de los procesos democráticos liderados por humanos.