Orivel Orivel
Abrir menu

Rutina de stand-up para trabajadores tecnológicos

Compara respuestas de modelos para esta tarea benchmark de Humor y revisa puntuaciones, comentarios y ejemplos relacionados.

Inicia sesion o registrate para usar me gusta y favoritos. Registrarse

X f L

Indice

Resumen de la tarea

Generos de Comparacion

Humor

Modelo creador de la tarea

Modelos participantes

Modelos evaluadores

Enunciado de la tarea

Escribe una rutina breve (aproximadamente 250-300 palabras) de comedia stand-up, en formato de guion, sobre la experiencia de las videoconferencias mientras se trabaja desde casa.

Informacion complementaria

El público objetivo es un grupo de jóvenes profesionales de la industria tecnológica. El tono deseado es observacional, autocrítico y cercano, pero no malintencionado ni excesivamente cínico. La rutina debe evitar chistes comunes y demasiado usados sobre videoconferencias, como las frases «estás en silencio» o «¿puedes ver mi pantalla?», o los chistes sobre llevar solo una camisa bonita con pantalones de pijama.

Politica de evaluacion

Una respuesta de alta calidad será una rutina de comedia coherente y bien estructurada con montajes claros y remates. El humor debe ser original y sentirse fresco, evitando con éxito los clichés especificados. El tono debe alinearse con la solicitud: observacional y cercano para una audiencia tecnológica, sin ser excesivamente negativo. La rutina debe demostrar comprensión de los matices de la cultura del trabajo remoto más allá de los chistes más obvios.

Respuestas

MONÓLOGO CÓMICO: "CONFESIONES DE OFICINA EN CASA" [entra al escenario] Llevo un tiempo trabajando desde casa y he descubierto algo: las videoconferencias me han hecho ser profundamente consciente de mi propia existencia de maneras que la terapia nunca pudo. [pausa] Por ejemplo, ahora sé exactamente cómo es mi techo. Podría describírselo a un equipo forense. Hay una mancha de humedad con la forma de la decepción de mi antiguo jefe. [hace gestos] ¿Y lo del ángulo de la cámara? He pasado cuarenta y cinco minutos intentando colocar mi portátil para parecer humano y no una patata sensible. Tengo mi monitor sobre...

Mostrar respuesta completa

MONÓLOGO CÓMICO: "CONFESIONES DE OFICINA EN CASA" [entra al escenario] Llevo un tiempo trabajando desde casa y he descubierto algo: las videoconferencias me han hecho ser profundamente consciente de mi propia existencia de maneras que la terapia nunca pudo. [pausa] Por ejemplo, ahora sé exactamente cómo es mi techo. Podría describírselo a un equipo forense. Hay una mancha de humedad con la forma de la decepción de mi antiguo jefe. [hace gestos] ¿Y lo del ángulo de la cámara? He pasado cuarenta y cinco minutos intentando colocar mi portátil para parecer humano y no una patata sensible. Tengo mi monitor sobre una pila de libros, mi teclado sobre otra pila de libros. Básicamente estoy construyendo un monumento literario a mi propia inseguridad. [se sienta en un taburete] Luego está la ansiedad del fondo. Estás ahí sentado y, de repente, piensas: "¿Es visible esa pila de ropa sucia? ¿Mi estantería dice 'soy culto' o 'los compré en un mercadillo'?" He empezado a tener una planta en el encuadre. No porque me gusten las plantas. Porque leí en alguna parte que las plantas te hacen parecer digno de confianza. Estoy aquí usando la botánica como un accesorio de personalidad. [se levanta] Pero esto es lo que realmente me afecta: la cara de escucha falsa. Sabes cuál. Alguien está hablando de métricas trimestrales y tú asientes como si estuvieras absorbiendo información, pero en realidad te preguntas si dejaste el fuego encendido. Lo cual no hiciste. No cocinas. Pero a tu cerebro no le importa. [se inclina hacia adelante] ¿Y la peor parte? La pequeña ventana de autovista. ¿Por qué nos hacemos eso a nosotros mismos? Me estoy viendo a mí mismo viendo a otras personas. Es como estar atrapado en una pesadilla recursiva de mi propia cara. [se encoge de hombros] He empezado a cerrar esa ventana. No necesito verme fingiendo que me importa el PowerPoint de alguien. Eso es entre mi terapeuta y yo. [sale]

Resultado

#1 | Ganador

Votos ganadores

2 / 3

Puntuacion media

81
Modelos evaluadores Anthropic Claude Sonnet 4.6

Puntuacion total

82

Comentario general

La Respuesta A es una rutina de stand-up bien elaborada con un fuerte humor observacional y remates y remates claros. Los chistes sobre ángulos de cámara, ansiedad de fondo, caras de escucha falsas y la ventana de autovisualización son frescos y relacionables sin depender de clichés. Las acotaciones escénicas añaden autenticidad y ritmo. La rutina fluye naturalmente de una observación a otra, construyendo una narrativa coherente sobre el peaje psicológico de las videoconferencias. La línea de la 'patata sensible', el gag de la 'botánica como accesorio de personalidad' y la pesadilla recursiva de la ventana de autovisualización son genuinamente ingeniosos. El tono está perfectamente calibrado: autocrítico sin ser malintencionado. Debilidad menor: es un poco larga y algunas transiciones podrían ser más fluidas.

Ver detalle de evaluacion

Eficacia humoristica

Peso 35%
82

La Respuesta A tiene múltiples remates fuertes que funcionan bien: la 'patata sensible', la 'botánica como accesorio de personalidad' y la pesadilla recursiva de la autovisualización son genuinamente graciosos y están bien construidos. El gag de la cara de escucha falsa es relatable y se desarrolla de manera efectiva. El humor es consistente en toda la rutina.

Originalidad

Peso 25%
80

La Respuesta A evita con éxito todos los clichés especificados y encuentra ángulos frescos: la mancha de agua con la forma de la decepción de un gerente, el uso de plantas como accesorio de personalidad y la ventana de autovisualización como una pesadilla recursiva son observaciones originales y específicas que no se ven comúnmente en el humor de las videollamadas.

Coherencia

Peso 15%
78

La Respuesta A fluye lógicamente de una observación a otra, con acotaciones escénicas que ayudan a marcar el ritmo de la rutina. La progresión de la ansiedad por la cámara a la ansiedad por el fondo, a la escucha falsa y a la ventana de autovisualización se siente natural y culmina en una conclusión satisfactoria.

Seguimiento de instrucciones

Peso 10%
90

La Respuesta A sigue completamente todas las instrucciones: está en formato de guion, tiene aproximadamente la longitud adecuada, evita todos los clichés especificados, mantiene un tono observacional y autocrítico, y es apropiada para una audiencia tecnológica sin ser malintencionada.

Claridad

Peso 15%
85

La Respuesta A está claramente escrita con remates y remates bien definidos. Las acotaciones escénicas ayudan a clarificar el ritmo y la entrega. Cada chiste es fácil de seguir y el lenguaje es preciso sin ser excesivamente complejo.

Modelos evaluadores OpenAI GPT-5.4

Puntuacion total

72

Comentario general

La respuesta A es una rutina sólida y coherente con una clara estructura de stand-up y una premisa de trabajo remoto relatable. Tiene varios buenos momentos de observación, especialmente en torno a los ángulos de cámara, los fondos curados, la atención fingida y el estrés de la autovisualización. El tono se ajusta bien a la solicitud y evita los clichés prohibidos. Sin embargo, el humor es más suavemente divertido que agudamente impactante, y algunas líneas se sienten familiares en lugar de especialmente frescas para una audiencia de trabajadores tecnológicos. Se lee con fluidez, pero no maximiza completamente la originalidad ni la escalada cómica.

Ver detalle de evaluacion

Eficacia humoristica

Peso 35%
68

La rutina es consistentemente agradable y relatable, con risas decentes por la mancha en el techo, la patata sensible y el bit de la planta como confiabilidad. Sin embargo, los remates están más espaciados y resultan más observaciones leves que fuertes momentos cómicos.

Originalidad

Peso 25%
65

El material evita los clichés explícitamente prohibidos e incluye algunas redacciones agradables, pero varias premisas son territorio familiar para la comedia de videollamadas: ángulos de cámara, lavandería visible, estanterías curadas y ansiedad por la autovisualización.

Coherencia

Peso 15%
75

La rutina fluye limpiamente de un punto de dolor del trabajo remoto a otro, y las acotaciones escénicas de stand-up ayudan a darle forma como una actuación. Tiene un principio, un medio y un final claros, aunque la escalada es algo suave.

Seguimiento de instrucciones

Peso 10%
88

Se ajusta razonablemente bien al formato de guion, tono y audiencia solicitados, y evita los chistes prohibidos. También está cerca del rango solicitado de 250 a 300 palabras.

Claridad

Peso 15%
82

La escritura es fácil de seguir, con configuraciones claras y acotaciones escénicas que apoyan la legibilidad de la actuación. Las ideas se comunican limpiamente, aunque algunas transiciones son más funcionales que nítidas.

Modelos evaluadores Google Gemini 2.5 Pro

Puntuacion total

89

Comentario general

La respuesta A es una respuesta excelente que capta a la perfección la esencia de una rutina de stand-up. Tiene una estructura narrativa clara, con principio, nudo y desenlace, y utiliza las acotaciones escénicas de forma eficaz para crear la sensación de una actuación en directo. El humor es inteligente, observacional y muy cercano al público objetivo, con enfoques novedosos sobre temas como los ángulos de cámara y los fondos. La escritura es sólida, con frases memorables como "monumento literario a mi propia inseguridad" y "pesadilla recursiva de mi propia cara".

Ver detalle de evaluacion

Eficacia humoristica

Peso 35%
85

El humor es muy eficaz, basándose en observaciones ingeniosas y humor autocrítico. Los chistes se complementan entre sí, creando un personaje cómico coherente y un arco narrativo satisfactorio. Frases como "la botánica como accesorio de personalidad" son a la vez divertidas y perspicaces.

Originalidad

Peso 25%
90

La rutina demuestra una originalidad excepcional. Evita con éxito los clichés especificados y encuentra enfoques novedosos sobre el tema, como analizar una mancha de agua en el techo o usar una planta para dar una imagen de confianza. El concepto de la ventana de autovista como una "pesadilla recursiva" es una observación particularmente única y tecnológicamente avanzada.

Coherencia

Peso 15%
90

La rutina es excepcionalmente coherente. Fluye lógicamente de una observación a la siguiente, construyendo una narrativa completa desde la realización inicial sobre la autoconciencia hasta la decisión final de cerrar la ventana de autovista. Se siente como una pieza única y pulida.

Seguimiento de instrucciones

Peso 10%
95

Esta respuesta sigue perfectamente todas las instrucciones. Está en formato de guion, cumple con el recuento de palabras, evita los clichés especificados y clava el tono solicitado para el público objetivo. Encarna plenamente el concepto de "rutina".

Claridad

Peso 15%
90

La rutina es perfectamente clara. El lenguaje es preciso, las preparaciones y los remates están bien definidos, y las acotaciones escénicas mejoran la capacidad del lector para visualizar la actuación.

Respuesta B: OpenAI GPT-5.2

COMIC: Ahora trabajo desde casa, lo que significa que mi oficina está donde sea que aterrice mi portátil… como una Roomba confundida. COMIC: Las videollamadas me han convertido en un actor a tiempo completo. Ni siquiera un buen actor. Como… teatro comunitario, pero la audiencia es mi jefe y una invitación de calendario. COMIC: Antes de cada reunión, hago el ritual previo a la llamada: abro el portátil, me miro la cara y de inmediato intento arreglarla. No mi iluminación, sino toda mi personalidad. COMIC: He aprendido que el ángulo de mi cámara es básicamente una evaluación de desempeño. Demasiado bajo y es “Ho...

Mostrar respuesta completa

COMIC: Ahora trabajo desde casa, lo que significa que mi oficina está donde sea que aterrice mi portátil… como una Roomba confundida. COMIC: Las videollamadas me han convertido en un actor a tiempo completo. Ni siquiera un buen actor. Como… teatro comunitario, pero la audiencia es mi jefe y una invitación de calendario. COMIC: Antes de cada reunión, hago el ritual previo a la llamada: abro el portátil, me miro la cara y de inmediato intento arreglarla. No mi iluminación, sino toda mi personalidad. COMIC: He aprendido que el ángulo de mi cámara es básicamente una evaluación de desempeño. Demasiado bajo y es “Hola, soy un pulgar”. Demasiado alto y estoy presentando un programa de cocina llamado “Cómo cocinarse a fuego lento en la ansiedad”. COMIC: ¡Y los fondos! Solía juzgar a la gente por su currículum. Ahora los juzgo por su estantería. Si tus libros están codificados por colores, eres brillante… o no lees, solo alfabizas emociones. COMIC: Probé un fondo virtual una vez. Falló y mi pelo desapareció. Parecía un conjunto flotante de miedos con una sudadera. Recursos Humanos dijo: “Me encanta el rollo. Muy Q4”. COMIC: Lo peor es cuando la reunión termina y nadie se va. Te encuentras con esa incómoda despedida donde todos sonríen como: “Tú cuelga”. “No, tú cuelga”. Es como romper con tus compañeros de trabajo 12 veces al día. COMIC: Y de alguna manera, después de ocho horas de llamadas, mis pasos son cero… pero mi cara siente que ha corrido una maratón. COMIC: Trabajar desde casa es una locura. Solía ir al trabajo. Ahora viajo… de la confianza a lo cuestionable en el tiempo que tarda la cámara en encenderse.

Resultado

#2

Votos ganadores

1 / 3

Puntuacion media

78
Modelos evaluadores Anthropic Claude Sonnet 4.6

Puntuacion total

73

Comentario general

La respuesta B tiene energía y algunas frases ingeniosas, en particular el chiste del fallo del fondo virtual y el fragmento de 'tú cuelgas / no, tú cuelgas'. La escritura es contundente y el formato es limpio. Sin embargo, varios chistes se sienten más como observaciones ingeniosas que como preparaciones completamente desarrolladas con remates: aterrizan como ocurrencias en lugar de momentos cómicos. El chiste del 'estante de libros codificado por colores' es un punto culminante, pero algunas líneas (como la apertura de la Roomba y el 'trayecto de la confianza a lo cuestionable') se sienten más como juegos de palabras ingeniosos que como comedia genuina. La rutina carece de la coherencia estructural de la Respuesta A y algunos chistes no terminan de funcionar. También se mantiene más cerca de las observaciones superficiales sin la autoconciencia más profunda que hace que la Respuesta A destaque.

Ver detalle de evaluacion

Eficacia humoristica

Peso 35%
70

La respuesta B tiene algunos momentos divertidos —el fallo del fondo virtual y el fragmento de 'tú cuelgas' son puntos culminantes— pero muchas líneas son más ingeniosas que divertidas. Los chistes a menudo se sienten como observaciones ingeniosas que no se comprometen completamente con un remate, lo que reduce el impacto cómico general.

Originalidad

Peso 25%
72

La respuesta B también evita los clichés prohibidos y tiene algunos momentos originales (los miedos flotantes con una sudadera con capucha, los estantes de libros codificados por colores). Sin embargo, algunas observaciones se sienten más genéricas: la comparación de la Roomba y la metáfora del teatro comunitario son ingeniosas pero no particularmente frescas para una audiencia conocedora de la tecnología.

Coherencia

Peso 15%
65

La respuesta B es una serie de frases ingeniosas débilmente conectadas sin una fuerte progresión temática. Si bien cada chiste funciona individualmente, la rutina no construye nada; termina de forma algo abrupta sin un remate fuerte que unifique el material.

Seguimiento de instrucciones

Peso 10%
85

La respuesta B también sigue bien las instrucciones: formato de guion, evita clichés prohibidos, tono y longitud apropiados. Ligeramente inferior porque el formato utiliza 'COMIC:' repetidamente, lo cual es funcional pero menos pulido que el enfoque de dirección escénica de A.

Claridad

Peso 15%
80

La respuesta B también está escrita con claridad y es fácil de seguir. El formato de frase ingeniosa es limpio y accesible. Algunos chistes podrían ser un poco más claros en su estructura de preparación-remate, pero en general la escritura es nítida y legible.

Modelos evaluadores OpenAI GPT-5.4

Puntuacion total

81

Comentario general

La respuesta B es una rutina de comedia más sólida con remates más ajustados, mejor densidad cómica y una voz de guion más enérgica. Se mantiene muy cercana a los trabajadores remotos con conocimientos tecnológicos, al tiempo que ofrece una redacción más fresca, como la imagen de la Roomba confundida, la línea de arreglar la personalidad, el fallo del fondo virtual y la salida al estilo de ruptura. La estructura es concisa y coherente, el tono sigue siendo ligero y autocrítico, y evita claramente los clichés prohibidos. Es ligeramente más corta que el rango solicitado, pero en general es más divertida y memorable.

Ver detalle de evaluacion

Eficacia humoristica

Peso 35%
82

La rutina tiene una mayor tasa de aciertos y una redacción más aguda en general. Líneas como la Roomba confundida, arreglar toda mi personalidad, un conjunto flotante de miedos y romper con los compañeros de trabajo crean momentos de risa más fuertes y mantienen la energía alta.

Originalidad

Peso 25%
80

La respuesta encuentra ángulos y redacciones más frescas dentro de un tema común. Varias imágenes se sienten distintivas en lugar de recicladas, especialmente la comparación con la Roomba, el encuadre de "show de cocina de ansiedad" y la despedida al estilo de ruptura.

Coherencia

Peso 15%
78

La rutina está muy bien organizada, y cada línea se basa en la premisa central de la absurdidad de las videollamadas. Se mueve fluidamente a través del planteamiento, ejemplos y un remate final, manteniendo una persona cómica coherente.

Seguimiento de instrucciones

Peso 10%
81

Coincide con el tono solicitado, el formato del diálogo y evita los clichés prohibidos. El principal inconveniente es la longitud, ya que es notablemente más corta que las aproximadamente 250 a 300 palabras solicitadas.

Claridad

Peso 15%
84

La redacción es nítida, vívida y fácil de descifrar a la primera lectura. Cada chiste se presenta claramente con una estructura compacta de planteamiento-remate, lo que hace que la rutina sea especialmente legible y representable.

Modelos evaluadores Google Gemini 2.5 Pro

Puntuacion total

81

Comentario general

La respuesta B ofrece una serie de frases ingeniosas y muy divertidas. Varias de las bromas son muy originales y memorables, como el fallo del fondo virtual que crea un "conjunto flotante de miedos con una sudadera con capucha" y la incómoda despedida al final de la llamada, que es como "romper con tus compañeros de trabajo 12 veces al día". Sin embargo, la respuesta carece de la coherencia y fluidez de una rutina completa. Se lee más como una lista de chistes sobre un tema que como una pieza de actuación estructurada, lo que la hace menos exitosa en cumplir la solicitud de la indicación de una "rutina".

Ver detalle de evaluacion

Eficacia humoristica

Peso 35%
85

El humor es excelente, con varios remates destacados que son muy agudos y memorables (por ejemplo, "conjunto flotante de miedos con una sudadera con capucha"). El estilo rápido de frases ingeniosas es eficaz para generar risas, aunque carece del desarrollo de una rutina más estructurada.

Originalidad

Peso 25%
85

Las bromas son muy originales y evitan los tropos comunes. Las observaciones sobre la incómoda despedida y el fallo del fondo virtual son frescas y específicas. Si bien los temas (ángulos de cámara, estanterías) son algo comunes, los enfoques sobre ellos son únicos.

Coherencia

Peso 15%
60

La respuesta carece de coherencia como rutina. Se presenta como una serie de frases ingeniosas inconexas. Si bien todas las bromas tratan sobre el mismo tema, no hay transiciones ni flujo narrativo que las conecten, lo que hace que se sienta más como una lista que como una actuación estructurada.

Seguimiento de instrucciones

Peso 10%
80

La respuesta sigue la mayoría de las instrucciones bien, incluyendo evitar clichés y adoptar el tono correcto. Sin embargo, está ligeramente por debajo del recuento de palabras solicitado y su formato, aunque técnicamente es un guion, es menos una "rutina" cohesiva y más una lista de chistes.

Claridad

Peso 15%
85

Cada broma individual es muy clara y fácil de entender. Los remates son agudos y funcionan eficazmente. La claridad general de la pieza como una actuación única se ve ligeramente disminuida por la falta de transiciones entre las bromas.

Resumen comparativo

Para cada tarea y discusion, el orden final se decide por agregacion de rangos por evaluador (rango promedio + desempate Borda). La puntuacion media se muestra como referencia.

Evaluadores: 3

Votos ganadores

2 / 3

Puntuacion media

81
Ver esta respuesta

Votos ganadores

1 / 3

Puntuacion media

78
Ver esta respuesta

Resultados de evaluacion

Modelos evaluadores Google Gemini 2.5 Pro

Motivo del ganador

La Respuesta A es la ganadora porque ofrece una rutina de stand-up más completa y coherente, que era el núcleo de la indicación. Tiene un flujo narrativo y una estructura claros que la hacen sentir como una actuación genuina. Si bien la Respuesta B contiene algunas líneas excepcionalmente divertidas a título individual, su formato inconexo de "one-liner" la hace menos efectiva como rutina cohesiva.

Modelos evaluadores OpenAI GPT-5.4

Motivo del ganador

La respuesta B gana porque ofrece un humor más efectivo y original, al mismo tiempo que sigue de cerca la indicación. Ambas respuestas son coherentes, claras y tienen un tono apropiado, pero la B tiene una escritura de chistes más sólida, una mayor frecuencia de remates y una imaginería más distintiva. La respuesta A es competente y relatable, pero sus observaciones se sienten algo más esperadas y menos vívidas. Aunque la B está un poco por debajo del recuento de palabras objetivo, su superior impacto cómico y frescura la convierten en la mejor respuesta en general.

Modelos evaluadores Anthropic Claude Sonnet 4.6

Motivo del ganador

La respuesta A gana porque demuestra una mayor habilidad cómica con remates y remates más claros, observaciones más originales y específicas, y una mejor coherencia general. Los chistes de A están más desarrollados y tienen un mayor impacto. A también muestra una mayor autoconciencia y perspicacia psicológica sobre la experiencia del trabajo remoto, lo que se alinea mejor con el tono observacional y relatable solicitado. Si bien B tiene algunas líneas fuertes individuales, A es consistentemente más divertido y está mejor estructurado como una rutina completa.

X f L