Design eines URL-Shortening-Dienstes im großen Maßstab

Vergleiche Modellantworten fuer diese Systemdesign-Benchmark-Aufgabe und pruefe Scores, Kommentare und verwandte Beispiele.

Bitte einloggen oder registrieren, um Likes und Favoriten zu nutzen. Registrieren

X f L

Inhalt

Aufgabenubersicht

Vergleichsgenres

Systemdesign

Aufgaben-Erstellermodell Das Aufgabenmodell wird zufallig aus den fuhrenden Aufgaben-Generierungsmodellen der unterstutzten Anbieter ausgewahlt.

Anthropic Claude Opus 4.6

Antwortende Modelle In diesem Benchmark sind Modelle desselben Anbieters wie das Aufgabenmodell von der Beantwortung ausgeschlossen.

Antwort A OpenAI GPT-5 mini

Antwort B Google Gemini 2.5 Flash

Bewertungsmodelle Die Bewertung nutzt genau 3 Bewertungsmodelle, wobei die antwortenden Modelle ausgeschlossen sind. Mindestens 1 Juror wird aus Top-Modellen ausgewaehlt, leichte Modelle werden nicht als Juroren ausgewaehlt, und die 3 Juroren stammen aus 3 unterschiedlichen Anbietern.

OpenAI GPT-5.2 Anthropic Claude Sonnet 4.6 Google Gemini 2.5 Pro

Aufgabenstellung

Mehr anzeigen ▼

Sie haben den Auftrag, einen URL-Shortening-Dienst (ähnlich wie bit.ly oder tinyurl.com) zu entwerfen, der folgende Anforderungen erfüllen muss: 1. Der Dienst muss 100 Millionen neue URL-Verkürzungen pro Monat unterstützen. 2. Das Verhältnis von Lese- zu Schreibzugriffen beträgt 100:1 (d. h. 10 Milliarden Weiterleitungen pro Monat). 3. Kurz-URLs dürfen höchstens 7 Zeichen lang sein (alphanumerisch). 4. Kurz-URLs dürfen nicht vorhersagbar oder sequentiell sein. 5. Das System muss 99,9 % Verfügbarkeit erreichen. 6. Die Weiterleitungs-Latenz muss unter 10 ms beim 95. Perzentil liegen. 7. Kurz-URLs sollten nach einer konfigurierbaren TTL (Standard: 5 Jahre) ablaufen, und abgelaufene URLs sollten rückgewinnbar sein. 8. Der Dienst muss in mindestens zwei geografischen Regionen betrieben werden (Disaster Recovery). Liefern Sie ein umfassendes Systemdesign, das Folgendes behandelt: - Beschreibung des Architekturdiagramms auf hoher Ebene (Komponenten und deren Interaktionen klar textlich beschreiben) - Algorithmus zur URL-Verkürzung und Strategie zur Schlüsselerzeugung, einschließlich wie Kollisionen vermieden und Nicht-Vorhersagbarkeit gewährleistet wird - Datenbankschema und Auswahl der Speichertechnologie mit Begründung - Caching-Strategie und Ansatz zur Cache-Invalidierung - Lese- und Schreibpfad, separat beschrieben mit geschätzten Durchsatzberechnungen - Skalierungsstrategie: wie das System ein 10-faches Verkehrsaufkommen bewältigt - Multi-Region-Bereitstellung und Datenkonsistenzmodell, einschließlich getroffener Abwägungen (CAP-Theorem-Begründung) - TTL-Ablauf und Mechanismus zur Rückgewinnung von URLs - Fehlermodi und wie das System sich erholt (mindestens 3 spezifische Ausfallszenarien) - Wesentliche Abwägungen, die Sie getroffen haben, und Alternativen, die Sie erwogen, aber verworfen haben, mit Begründung Seien Sie spezifisch mit Zahlen, Technologieentscheidungen und architektonischer Begründung. Vermeiden Sie vage Allgemeinplätze. Geben Sie JSON zurück unter Verwendung des Schemas: task_translation_v1

Bewertungsrichtlinie

Mehr anzeigen ▼

Eine starke Antwort sollte anhand der folgenden Dimensionen bewertet werden: 1. Vollständigkeit: Behandelt die Antwort explizit alle zehn Aufzählungspunkte? Fehlende Abschnitte sollten bewertet werden. 2. Quantitative Argumentation: Enthält die Antwort konkrete Durchsatzberechnungen (z. B. QPS für Reads und Writes), Speicherabschätzungen und Kapazitätsplanungszahlen, die aus den gegebenen Anforderungen abgeleitet sind? Vage Aussagen wie „verwende einen Load Balancer" ohne Dimensionierung sind unzureichend. 3. Algorithmusdesign: Die Strategie zur Schlüsselerzeugung sollte das 7-Zeichen-Limit ansprechen, den Schlüsselraum berechnen (z. B. 62^7 ≈ 3,5 Billionen), konkret erklären, wie Kollisionen vermieden werden (z. B. vorab generierte Schlüssel, Base62-Codierung eindeutiger IDs oder Ähnliches), und erläutern, wie Nicht-Vorhersagbarkeit erreicht wird. 4. Technologische Begründung: Speicher-, Caching- und Infrastrukturentscheidungen sollten konkret benannt und mit Abwägungen begründet werden, nicht nur als Liste aufgeführt. 5. Konsistenz- und CAP-Argumentation: Der Multi-Region-Abschnitt sollte ausdrücklich das gewählte Konsistenzmodell (eventuell vs. stark) diskutieren, erklären, warum dieses gewählt wurde, und darlegen, was dafür geopfert wird. 6. Fehleranalyse: Mindestens drei konkrete, realistische Ausfallszenarien sollten beschrieben werden, inklusive konkreter Wiederherstellungsmechanismen — keine generischen Aussagen. 7. Tiefe der Abwägungen: Die Antwort sollte echte architektonische Trade-offs darstellen und Alternativen, die verworfen wurden, mit klarer Begründung nennen, um Entwurfsreife zu demonstrieren. 8. Kohärenz: Das Gesamtdesign sollte intern konsistent sein — in einem Abschnitt referenzierte Komponenten müssen mit Entscheidungen in anderen Abschnitten übereinstimmen. 9. Klarheit und Struktur: Die Antwort sollte gut organisiert und leicht nachvollziehbar sein. 10. Praktikabilität: Das Design sollte realistisch und umsetzbar sein, nicht rein theoretisch.

Antworten

Antwort A: OpenAI GPT-5 mini

Vollstandige Antwort anzeigen ▼

Architecture de haut niveau (diagramme textuel et composants) - Clients : navigateurs web, applications mobiles. Ils accèdent aux URL courtes (short.example/abc1234) et à l'API d'écriture pour créer des URL courtes. - CDN / Edge (CloudFront, Fastly) : Couche Edge qui reçoit les requêtes d'URL courtes entrantes. L'Edge mettra en cache les réponses de redirection (HTTP 301/302) et les servira sans toucher à l'origine autant que possible pour respecter le SLA de latence. - Routage Edge / DNS global (Route53, anycast) : Route les appels de l'API d'écriture vers la région la plus proche et les accès aux URL courtes vers l'Edge/région la plus proche. Des vérifications de santé et des basculements sont configurés. - API Gateway régionale + Load Balancer (API Gateway / ALB) : Accepte les écritures des clients et les appels de gestion. Route vers les services d'écriture déployés dans des conteneurs (ECS/Kubernetes) à travers les zones de disponibilité. - Service d'écriture (microservice sans état) : Valide l'entrée, génère un jeton court via le module de génération d'ID, écrit le mappage dans la base de données principale, publie des événements dans le flux, met à jour les caches et renvoie l'URL courte. - Services de chemin de lecture / Service de redirection (sans état) : Reçoit les misses de cache de l'Edge ou les accès directs, interroge le cache local (cluster Redis), se rabat sur la base de données, renvoie la redirection avec les en-têtes de cache appropriés. - Cache distribué (clusters Redis par région, clusterisé/répliqué) : Les recherches à chaud sont stockées ici pour des réponses en microsecondes. Chaque région possède son propre cluster Redis avec réplication entre les AZ. - Stockage principal (DynamoDB ou alternative Cassandra/Scylla) : Stocke le mappage short_id -> long_url, les métadonnées, l'expiration, le propriétaire, le timestamp de création. Choisi pour son débit élevé en lecture/écriture, son support TTL et sa réplication multi-région. - Flux d'événements (Kinesis / Kafka) : Toutes les écritures produisent des événements pour l'analyse, les mises à jour d'index, les messages d'invalidation de cache et le traitement asynchrone. - Workers d'arrière-plan (conteneurisés) : Gèrent le nettoyage TTL, la file d'attente de récupération, l'analyse et les vérifications de réplication asynchrone. - Surveillance & Ops : Prometheus/Grafana, CloudWatch, alertes, runbooks automatisés. Interactions des composants (lecture) : L'utilisateur accède à une URL courte -> Le cache Edge vérifie le cache de redirection -> si trouvé, renvoie la redirection mise en cache (<5 ms). Si manquant, l'Edge transfère vers le LB régional -> Le service de redirection interroge le cache Redis -> si trouvé, renvoie la redirection et l'Edge la met en cache ; si manquant, le service de redirection interroge la base de données principale -> renvoie la redirection -> Redis est mis à jour et l'Edge met en cache la redirection. Interactions des composants (écriture) : Le client appelle l'API -> API Gateway -> Service d'écriture -> Le générateur d'ID produit un jeton -> Le service d'écriture écrit le mappage dans la base de données principale avec TTL -> Le service d'écriture publie un événement dans le flux -> Le service d'écriture écrit dans le cache Redis et renvoie l'URL courte. Les workers d'arrière-plan répliquent de manière asynchrone les événements vers l'analyse et d'autres régions si nécessaire. Algorithme de raccourcissement d'URL et stratégie de génération de clés Objectifs : Jeton alphanumérique max de 7 caractères, non devinable (pas de jetons séquentiels), faible probabilité de collision, comportement de panne/réessai reproductible. Espace et contraintes : 62^7 ~= 3,52e12 jetons possibles. La cible mensuelle de 100 millions de nouveaux jetons est infime par rapport à l'espace, mais nous devons garantir qu'il n'y a pas d'énumération facile. Stratégie choisie (principale) : - Utiliser une génération aléatoire cryptographiquement sécurisée par nouvelle URL courte. Générer un entier aléatoire de 64 bits cryptographiquement sécurisé, appliquer un échantillonnage par rejet pour mapper dans l'intervalle [0, 62^7 - 1] sans biais de modulo, puis encoder en base62 en exactement 7 caractères. Cela produit des jetons uniformément aléatoires dans l'espace de 7 caractères et aucune séquentialité. - Avant de valider, tenter une insertion atomique dans la base de données avec short_id comme clé primaire et unicité garantie. Si l'insertion échoue en raison d'une rare collision, réessayer avec un nouveau jeton aléatoire (probabilité de collision attendue négligeable ; réessais attendus << 1). Pourquoi pas d'ID séquentiels ou d'encodage bijectif d'un compteur croissant : les ID séquentiels ou dérivés d'horodatages sont devinables et permettent l'énumération et le scraping. Nous les rejetons pour répondre à l'exigence de non-devinabilité. Alternative considérée et rejetée : hachages cryptographiques tronqués de l'URL longue (par exemple, les 7 premiers caractères base62 de SHA256). Rejetée car le mappage déterministe rend les jetons devinables si un attaquant peut hacher des URL populaires ; les collisions sont également plus fréquentes lors de la troncature. Nous aurions pu utiliser HMAC(longURL, secret) pour être déterministe et non devinable, mais le mappage déterministe empêche la réutilisation de jetons courts pour différentes variations d'entrée et complique le TTL/la révocation. Schéma de base de données et technologie de stockage (avec justification) Stockage principal choisi : DynamoDB (AWS) ou Cassandra/Scylla géré si auto-hébergé. Raison principale : service géré, évolutivité horizontale, débit élevé en lecture/écriture, support TTL intégré, réplication multi-région (DynamoDB Global Tables) et accès en millisecondes à un seul chiffre si provisionné de manière appropriée. Ceci est important pour une disponibilité de 99,9 % et des opérations simples. Schéma (logique, style DynamoDB) : - Table : url_map - Clé de partition : short_id (chaîne, 7 caractères) - Attributs : long_url (chaîne), created_at (timestamp), expires_at (timestamp), owner_id (chaîne), metadata (blob JSON), version (int), deleted (booléen), deletion_marked_at (timestamp), click_count (numérique, optionnel), analytics_shard_id (pour le sharding des clics) - Attribut TTL : expires_at pour l'expiration automatique par la fonctionnalité TTL de la base de données Index : aucun index secondaire global supplémentaire requis pour le chemin de redirection. Optionnellement un GSI sur owner_id pour la gestion et la suppression en masse par utilisateur, et un GSI sur deletion_marked_at pour le traitement de la récupération. Justification : Le modèle d'accès clé-valeur correspond bien à DynamoDB. Le short_id est la clé unique naturelle. Le TTL est intégré. Pour les autres fournisseurs cloud, utiliser Cosmos DB avec TTL ou Scylla/Cassandra avec TTL par ligne. Stratégie de mise en cache et d'invalidation Objectifs : Atteindre une latence de redirection au 95e percentile < 10 ms à grande échelle, minimiser la charge de la base de données, supporter le multi-région. Couches : - Mise en cache CDN (Edge) des réponses de redirection. L'Edge met en cache les 301/302 avec un TTL de cache calculé à partir de l'expiration du mappage ; le TTL de cache max est limité à la durée restante du TTL. Pour les URL courtes nouvellement créées, définir un court TTL de cache pendant les N premières secondes pour permettre la cohérence. - Cluster Redis régional (ElastiCache Redis Cluster avec mode cluster activé). Redis stocke le mappage short_id -> réponse de redirection sérialisée et les métadonnées d'expiration. Le TTL de la mise à jour Redis est égal à l'expiration du mappage. - Cache LRU local en mémoire (petit) dans le service de redirection pour les accès fréquents. Hypothèses de succès du cache et dimensionnement : - Supposer un taux de succès CDN de 70 % pour les URL courtes (liens populaires) ; taux de succès Redis pour les misses Edge ~85 % pour les modèles d'accès régionaux. Ceux-ci sont ajustables en fonction de l'utilisation. Population et invalidation du cache : - À l'écriture : Le service d'écriture écrit dans la base de données et écrit immédiatement dans Redis régional et publie un événement d'invalidation de cache dans le flux auquel toutes les régions s'abonnent. Cela garantit que les caches sont chauds et cohérents en quasi temps réel. - Lors de la mise à jour ou de la suppression : Le service d'écriture met à jour la base de données et publie un événement d'invalidation ; les abonnés suppriment les clés de Redis et invalident les caches Edge via les en-têtes cache-control ou en envoyant une requête PURGE/Cache à l'CDN (ou en définissant un court TTL de cache à 0 et en laissant l'Edge récupérer les données fraîches). Les appels de purge sont maintenus au minimum ; préférer l'expiration basée sur TTL et l'invalidation pub/sub. - Pour l'expiration TTL : s'appuyer sur le TTL de la base de données pour supprimer la ligne et les workers d'arrière-plan pour publier un événement d'invalidation afin de nettoyer les caches et d'ajouter le jeton à la file d'attente de récupération. Chemin de lecture (détaillé) et calculs de débit Calculs de trafic (mensuel de base -> par seconde) : - Écritures : 100 000 000 / 30 / 24 / 3600 ~= 38,6 écritures/sec en moyenne. Facteur de pic de 5 supposé pour le trafic diurne/soudain -> ~193 écritures/sec en pic. - Lectures (redirections) : 10 000 000 000 / 30 / 24 / 3600 ~= 3 858 lectures/sec en moyenne. Facteur de pic de 5 -> ~19 290 lectures/sec en pic. - Ratio lecture/écriture : 100:1 comme spécifié. Chemin de lecture (optimisé pour la latence) : 1. Le client demande short.example/abc1234 -> DNS résout vers le nœud Edge du CDN. 2. Recherche dans le cache Edge : si la redirection est mise en cache, renvoyer immédiatement HTTP 301/302. Cela couvre la majorité des requêtes pour les liens populaires. 3. Si le cache Edge est manquant : la requête est transférée vers le LB régional -> Service de redirection. 4. Le service de redirection consulte le cache en mémoire (minuscule) -> Redis cluster get(short_id). La requête GET Redis est inférieure à la milliseconde en fonction du réseau (généralement <1 ms dans la région). Si Redis est trouvé, le service renvoie la redirection et l'Edge la met en cache avec le TTL approprié. 5. Si Redis est manquant : le service interroge la base de données principale (DynamoDB GetItem) qui prend quelques millisecondes, typiquement 3-6 ms. Le service renvoie la redirection et remplit Redis et le cache Edge. Capacité de débit et exemples de dimensionnement : - Cluster Redis : supposer un pic de 20k lectures/sec. Déployer 3-5 shards avec réplication pour gérer 50k+ ops/sec et fournir une marge. Chaque shard dimensionné pour ~10k ops/sec (type de nœud approprié). Réplicas de lecture dans chaque AZ pour la haute disponibilité. - DynamoDB : besoin de capacité pour les écritures ~200 TPS en pic et les lectures pour les misses de cache. Si le taux de succès du cache est de 90 % au total, la charge de lecture de la base de données = 19 290 * 0,10 ~= 1 929 lectures/sec en pic. Avec des pics éventuels et un facteur de sécurité de 2, provisionner pour 4k lectures/sec cohérentes (ou utiliser des lectures éventuellement cohérentes pour diviser par deux le coût RCU). Chemin d'écriture (détaillé) et débit Chemin d'écriture : 1. Le client soumet la requête de création à l'API -> API Gateway -> LB régional -> Service d'écriture. 2. Le service d'écriture valide l'URL (nettoyage, vérifications de logiciels malveillants en option), vérifie les limites de débit et les quotas. 3. Générateur d'ID : utilise CSPRNG pour créer un jeton ; tente d'insérer dans la base de données avec une condition PutItem que short_id n'existe pas (atomique). Si PutItem échoue en raison d'une clé existante (rare), réessaie la génération. L'insertion inclut long_url, created_at, expires_at. 4. En cas d'insertion réussie, le service d'écriture écrit dans Redis pour un préchauffage immédiat du cache et publie un événement dans le flux pour l'analyse et la propagation inter-régions. 5. Renvoie l'URL courte au client. Dimensionnement du débit pour les écritures : - 39 écritures/sec en moyenne de base, pic provisionné ~200 écritures/sec. DynamoDB supporte facilement des milliers d'écritures/sec avec une capacité appropriée ou en mode à la demande. - Service d'écriture sans état, mis à l'échelle horizontalement : supposer que chaque instance peut gérer 200-500 req/s ; définir un groupe d'autoscaling pour maintenir une marge. À 200 écritures/sec en pic, 2-4 instances sont suffisantes ; allouer 10-20 pour la redondance et d'autres traitements comme la limitation de débit. Stratégie de mise à l'échelle et gestion d'une croissance 10x Scénario : une croissance 10x signifie 1 milliard d'écritures/mois et 100 milliards de redirections/mois. Stratégies : - Autoscaling : Tous les services sans état (écriture/redirection) s'adaptent automatiquement en fonction du CPU/RPS et de la latence des requêtes. Utiliser le cluster autoscaler pour les conteneurs. - Mise à l'échelle du cache : Ajouter des shards Redis et augmenter la mémoire. Le mode cluster Redis permet le re-sharding dynamique. Le CDN gère automatiquement la mise à l'échelle Edge. - Mise à l'échelle de la base de données : DynamoDB supporte la mise à l'échelle à la demande, ou augmenter la capacité d'écriture/lecture ; pour Cassandra/Scylla auto-hébergé, ajouter des nœuds et rééquilibrer les jetons. - Partitionnement : La clé de hachage DynamoDB distribue déjà sur les partitions. Pour Cassandra, s'assurer qu'il y a suffisamment de nœuds pour maintenir les partitions petites. - Limitation de débit et backpressure : Pour les pics soudains, appliquer des limites de débit par utilisateur et par clé d'API, et mettre en file d'attente les tâches d'arrière-plan pour le travail non critique (analyse). Implémenter une dégradation gracieuse (par exemple, refuser les nouvelles créations pour les clients abusifs) plutôt que d'impacter les redirections. - Trafic mondial : Ajouter plus de régions et répliquer les données. Ajouter des réplicas de lecture Redis inter-régions ou s'appuyer sur la mise en cache locale remplie par des lectures à la demande. Estimation de la capacité après 10x : - Pics de lecture ~200k/sec. Avec un taux de succès de cache de 90 %, les lectures de base de données en pic ~20k/sec. DynamoDB/DAX ou une mise en cache gérée devant la base de données seront nécessaires. Le cluster Redis sera mis à l'échelle à des centaines de shards, et le CDN restera le principal moyen de réduire la charge mondiale. Déploiement multi-région et modèle de cohérence Modèle choisi : Multi-région actif-actif avec cohérence éventuelle entre les régions pour les données non critiques. Utiliser DynamoDB Global Tables ou la réplication multi-DC de Cassandra. Logique et compromis CAP : - Exigence : 99,9 % de disponibilité et reprise après sinistre inter-régions. Privilégier la Disponibilité et la Tolérance aux Partitions (AP) par rapport à la Cohérence stricte (CP) car les redirections doivent rester disponibles même en cas de partitions régionales. Un léger retard dans la réplication des URL courtes nouvellement créées dans une autre région est acceptable ; l'utilisateur qui a créé l'URL l'utilise généralement immédiatement dans la même région et la verra grâce à l'écriture locale et au préchauffage du cache. - Implémentation : Le service d'écriture écrit dans la base de données de la région locale (DynamoDB local ou table de la même région) puis la réplication vers d'autres régions se fait via les tables globales. Les lectures dans une région lisent préférentiellement localement. Pour une cohérence locale forte lecture-après-écriture, utiliser une lecture fortement cohérente de DynamoDB dans la même région immédiatement après l'écriture, ou simplement s'appuyer sur le préchauffage immédiat du cache pour garantir que la redirection fonctionne dans la région de l'écrivain. Compromis : - La cohérence éventuelle simplifie la disponibilité mondiale et réduit la latence des lectures. Elle permet une courte fenêtre où une URL courte créée dans la région A peut ne pas être visible dans la région B tant que la réplication n'est pas terminée. Nous acceptons cela car les principaux SLA concernent la disponibilité et la latence des redirections. - Si une cohérence inter-régions stricte était requise, nous devrions implémenter un modèle CP avec réplication synchrone inter-régions, ce qui augmenterait considérablement la latence d'écriture et réduirait la disponibilité pendant les partitions ; donc rejeté. Expiration TTL et mécanisme de récupération d'URL Exigences : TTL configurable par URL courte (par défaut 5 ans), les URL expirées doivent être récupérables. Mécanisme : - Utiliser l'attribut TTL de la base de données (expires_at). DynamoDB supprime automatiquement les éléments après l'expiration du TTL, mais la suppression est éventuellement cohérente et peut ne pas être immédiate (peut prendre jusqu'à 48 heures dans certains systèmes). Par conséquent, nous implémentons un pipeline de récupération actif. - Lorsque expires_at approche (par exemple, dans les 24 heures), les workers d'arrière-plan marquent l'URL comme expirant et envoient un événement via le flux. Cela permet aux caches de définir des TTL courts et de préparer la purge. - Lors de l'expiration réelle, les workers d'arrière-plan recherchent les lignes expirées (en utilisant le GSI sur deletion_marked_at ou les événements TTL de la table) et déplacent la clé dans une file d'attente de récupération avec les métadonnées : short_id, deletion_marked_at, original_expires_at. - Politique de récupération : Introduire une période de grâce configurable (par exemple, 30 jours) après l'expiration pendant laquelle le short_id est marqué comme 'tombstone' (drapeau deleted et enregistrement tombstone conservés) pour éviter la réutilisation immédiate et pour se protéger contre le retard de réplication et les litiges des utilisateurs. Pendant la période de tombstone, le short_id résout en 404 ou en une page « ce lien a expiré » ; les clics sont enregistrés pour audit. - Après la période de grâce, le worker de récupération déplace le short_id dans un pool de jetons récupérables (sujet Kafka ou table de pool de jetons DynamoDB). Les jetons du pool peuvent être recyclés ; les jetons récupérés incluent un temps de refroidissement et ne sont jamais immédiatement réémis au même propriétaire sauf demande explicite. - Pour éviter les collisions de réutilisation et les abus, maintenir un index de tombstones pour les jetons récemment utilisés (taille limitée, par exemple, conservés pendant 1 an dans une table séparée) et vérifier avant la réutilisation. Alternativement, au lieu de réutiliser les jetons, préférer maintenir le taux de recyclage extrêmement bas car l'espace de 7 caractères est grand. Pannes et récupération 1) Panne CDN / Edge dans une région ou perturbation globale du fournisseur Edge - Impact : La mise en cache Edge est arrêtée ; plus de requêtes atteignent les services de redirection régionaux et les caches backend, augmentant la charge et la latence. - Récupération : Le trafic est redirigé par DNS/anycast vers d'autres Edges ou une origine de secours. Autoscaling de la flotte de redirection et augmentation du nombre d'instances. Utiliser Origin Shield et configurer le basculement d'origine. Servir les redirections directement depuis l'origine jusqu'à ce que l'Edge récupère. 2) Panne de la région de la base de données principale (panne complète AZ/région) - Impact : La base de données locale est indisponible ; les écritures et les lectures ne peuvent pas être servies depuis cette région. - Récupération : Basculement vers une autre région via les tables globales. Rediriger le DNS et l'API Gateway vers les régions saines. Comme les données sont répliquées de manière asynchrone, les écritures récentes dans la région défaillante peuvent être perdues pendant une courte période, sauf si les écritures ont été répliquées auparavant. Le système accepte cela en échange d'une haute disponibilité. La réconciliation en arrière-plan tente de réparer les conflits une fois la région revenue. 3) Panne ou partition du cluster Redis - Impact : Augmentation des misses de cache entraînant une charge accrue de la base de données et une latence accrue. - Récupération : Les clients se rabattent sur les lectures de la base de données ; augmenter la capacité de lecture de la base de données ou activer DAX (DynamoDB Accelerator) ou des nœuds Redis supplémentaires. Reconstruire le cluster Redis à partir d'instantanés de la base de données ou précharger les caches en récupérant les clés les plus chaudes à l'aide de l'analyse/listes de clés chaudes. Utiliser Redis Sentinel ou un cluster Redis géré avec basculement automatique pour assurer la redondance au niveau des nœuds. 4) Bug du service générateur d'ID provoquant des collisions ou l'épuisement des limites de débit - Impact : Échecs d'écriture, erreurs de jeton en double, ou incapacité à créer de nouveaux jetons. - Récupération : Concevoir le générateur comme un CSPRNG sans état ; si un bug est détecté, revenir à une version stable précédente et router les requêtes vers une implémentation de générateur de secours (par exemple, une bibliothèque RNG différente ou un compteur de secours à courte durée combiné à un sel HMAC). Ajouter une surveillance du taux de collision ; si le taux de collision dépasse un seuil trivial, arrêter d'émettre de nouveaux jetons et renvoyer 5xx jusqu'à résolution. 5) Retard dans la file d'attente du consommateur du flux d'événements ou panne du worker - Impact : Les invalidations de cache, le traitement de l'analyse et la récupération sont retardés. - Récupération : Autoscaling des consommateurs, prioriser les sujets d'invalidation et de récupération, et définir la rétention pour que les nouveaux consommateurs puissent rattraper. Reconstruire l'état à partir de la base de données si nécessaire. Principaux compromis et alternatives considérées 1) Choix du stockage : DynamoDB (NoSQL géré) vs RDBMS vs Cassandra/Scylla - Choisi : DynamoDB (ou Cassandra géré). Raison : échelle horizontale, TTL, service géré, tables globales pour le multi-région. RDBMS rejeté en raison de la complexité de mise à l'échelle, du sharding et de la latence de ligne unique plus lente à échelle extrême. 2) Génération de jetons : Jeton aléatoire vs compteur séquentiel vs hachage de l'URL longue - Choisi : Jetons aléatoires cryptographiquement sécurisés mappés en base62 sur 7 caractères. Raison : non devinable, distribution uniforme, mise à l'échelle triviale, faible probabilité de collision résolue par insertion conditionnelle DB. Compteurs séquentiels rejetés car devinables. Hachage déterministe rejeté en raison d'un risque de collision plus élevé et de la prévisibilité. 3) Multi-région actif-actif vs basculement actif-passif - Choisi : Actif-actif avec cohérence éventuelle. Raison : meilleure disponibilité et routage client plus simple vers la région la plus proche avec une faible latence. Actif-passif offre une cohérence plus forte mais augmente le temps de basculement et pourrait violer les exigences de latence/disponibilité. 4) Récupération de jetons vs ne jamais réutiliser de jetons - Choisi : Récupérable avec période de grâce/tombstone. Raison : l'espace de jetons est grand donc la réutilisation n'est pas souvent nécessaire, mais la récupération est requise par la spécification. La sécurité est accrue par la conservation des tombstones et un temps de refroidissement avant la réémission. Jamais réutiliser rejeté car après de nombreuses années, il pourrait y avoir un besoin de conserver l'espace de noms si les jetons sont épuisés dans des scénarios pathologiques. 5) Mise en cache Edge vs origine seule - Choisi : Mise en cache Edge intensive avec des TTL courts. Raison : atteindre une latence au 95e percentile < 10 ms pour les utilisateurs mondiaux. L'origine seule rejetée car la latence de l'origine et les sauts inter-régions dépasseraient le SLA de latence. Considérations opérationnelles et chiffres - SLO : 99,9 % de disponibilité ; surveiller la santé et la latence à l'Edge, Redis, DB et service d'écriture. Définir des seuils d'alerte pour les taux d'erreur et la latence au 95e percentile. - Exemples de planification de capacité : pour le trafic de base, provisionner la DB pour ~4k lectures/sec et ~200 écritures/sec en pic ; cluster Redis dimensionné pour ~30k ops/sec. Pour une échelle 10x, provisionner la DB pour ~40k lectures/sec et Redis pour ~300k ops/sec avec des shards en autoscaling. - Sécurité & atténuation des abus : limitation de débit par clé d'API/IP, analyse d'URL pour les logiciels malveillants (asynchrone optionnel), application de quotas par compte. Protéger les points d'accès avec WAF et clés d'API. - Rétention des données et confidentialité : Fournir des API de gestion pour que les utilisateurs suppriment/étendent le TTL ; sémantique de suppression logique pour l'auditabilité et conservation des tombstones. Résumé Cette conception utilise une approche de mise en cache multi-couches (Edge CDN + Redis régional) soutenue par un magasin NoSQL évolutif horizontalement (DynamoDB ou Cassandra) et des microservices sans état pour répondre aux exigences de débit et de latence. La génération de jetons utilise des jetons de 7 caractères base62 basés sur CSPRNG avec résolution des collisions basée sur la DB pour garantir la non-devinabilité. Le système privilégie la disponibilité et la tolérance aux partitions (cohérence éventuelle multi-région actif-actif) pour répondre aux SLA de disponibilité et de latence, tandis que la récupération et le TTL sont gérés par le TTL de la DB plus un pipeline de récupération avec une fenêtre de grâce de tombstone pour éviter les réutilisations accidentelles. L'architecture s'adapte horizontalement avec l'autoscaling et le sharding pour accueillir une croissance 10x, et inclut des chemins de récupération pour les modes de défaillance courants afin de répondre à l'objectif de disponibilité de 99,9 %.

Ergebnis

#1 | Sieger

Siegstimmen

3 / 3

Durchschnittsscore

Bewertungsmodelle OpenAI GPT-5.2

Gesamtpunktzahl

Gesamtkommentar

Sehr umfassend und erfüllt weitgehend alle Aufzählungspunkte der Aufforderung mit spezifischen Komponenten, Interaktionen und klaren Lese-/Schreibflüssen. Bietet konkrete QPS-Mathematik, Annahmen zur Cache-Trefferquote, Dimensionierungsbeispiele, eine solide, nicht erratbare 7-Zeichen-Schlüsselstrategie mit Kollisionsbehandlung und explizite Begründungen für Multi-Region-CAP. Die TTL-Ablauf-/Rückgewinnung ist durchdacht mit Tombstones und Kulanzzeiten gestaltet. Fehlermodi sind realistisch und beinhalten Wiederherstellungsmaßnahmen. Kleinere Schwächen: Einige Technologieentscheidungen werden als Optionen und nicht als ein einziger, festgelegter Stack präsentiert; einige Zahlen (z. B. CDN-Trefferquoten, Redis-Shard-Ops/Sekunde) sind plausibel, aber nicht rigoros begründet; einige Mechanismen (DynamoDB TTL-Eventing, regionsübergreifende Cache-Invalidierung) könnten für operative Realität gestrafft werden.

Bewertungsdetails anzeigen ▼

Architekturqualitat

Gewichtung 30%

Klare End-to-End-Architektur, einschließlich CDN/Edge, regionaler Dienste, Redis, primärem Speicher, Streaming und Hintergrundarbeitern; Interaktionen für Lesen/Schreiben sind explizit beschrieben und entsprechen den Latenzzielen.

Vollstandigkeit

Gewichtung 20%

Behandelt explizit alle angeforderten Punkte: Architekturdiagramm in Textform, Algorithmus, Schema/Technologie, Caching/Invalidierung, Lesen/Schreiben mit Durchsatz, 10-fache Skalierung, Multi-Region-Konsistenz/CAP, TTL+Rückgewinnung, mehrere Fehlermodi und Kompromisse mit abgelehnten Alternativen.

Trade-off-Analyse

Gewichtung 20%

Bietet mehrere konkrete Kompromisse (zufällig vs. sequenziell/Hash, aktiv-aktiv vs. aktiv-passiv, Rückgewinnung vs. niemals Wiederverwendung, Edge-Caching) mit Gründen, die mit Anforderungen wie Nicht-Erratbarkeit, Latenz und Verfügbarkeit verbunden sind.

Skalierbarkeit und Zuverlassigkeit

Gewichtung 20%

Guter Skalierungsplan (automatische Skalierung, Cache/DB-Skalierung, 10-fache Schätzungen), Multi-Region-DR-Ansatz und mehrere konkrete Fehlerszenarien mit Wiederherstellung; erkennt Auswirkungen der eventualen Konsistenz und deren Abhilfemaßnahmen an.

Klarheit

Gewichtung 10%

Gut organisiert mit klaren Abschnitten, obwohl ziemlich lang und präsentiert gelegentlich mehrere Technologieoptionen, was die Entscheidungsfindung leicht reduziert.

Bewertungsmodelle Anthropic Claude Sonnet 4.6

Gesamtpunktzahl

Gesamtkommentar

Antwort A ist ein umfassendes, gut strukturiertes Systemdesign, das alle zehn erforderlichen Stichpunkte mit starker quantitativer Begründung behandelt. Es liefert konkrete Durchsatzberechnungen (durchschnittlich 38,6 Schreibvorgänge/Sek., Spitzenwert 193/Sek. mit einem Faktor von 5; durchschnittlich 3.858 Lesevorgänge/Sek., Spitzenwert 19.290/Sek.), detaillierte Kapazitätsschätzungen für Redis und DynamoDB sowie eine klare Erklärung des Schlüsselraums von 62^7 ≈ 3,52 Billionen. Die CSPRNG-basierte Token-Generierung mit Ablehnungssampling und bedingter DB-Einfügung ist technisch solide und gut begründet. Die CAP-Theorem-Begründung ist explizit und auf die AP-Wahl bezogen. Fünf Fehlerszenarien werden mit konkreten Wiederherstellungsmechanismen beschrieben. Die Kompromisse sind wirklich substanziell, wobei abgelehnte Alternativen erklärt werden. Die mehrschichtige Caching-Strategie (CDN + Redis + In-Process LRU) ist kohärent und intern konsistent. Kleinere Schwächen sind der Spitzenfaktor von 5x, der ohne Begründung etwas willkürlich ist, und der Rückgewinnungsmechanismus, der zwar detailliert ist, in der Beschreibung aber leicht überkonstruiert wirkt. Insgesamt ist dies ein starkes, praktisch fundiertes Design.

Bewertungsdetails anzeigen ▼

Architekturqualitat

Gewichtung 30%

Antwort A beschreibt eine kohärente mehrschichtige Architektur mit CDN, regionalem Redis, DynamoDB Global Tables, zustandslosen Microservices und einem Event-Stream. Komponenten werden durchgängig in den Abschnitten referenziert. Die CSPRNG-Token-Generierung mit bedingter DB-Einfügung ist technisch solide. Die Lese- und Schreibpfade sind klar getrennt und intern konsistent mit den Speicher- und Caching-Auswahlen.

Vollstandigkeit

Gewichtung 20%

Antwort A behandelt explizit alle zehn erforderlichen Stichpunkte: Architektur, Algorithmus, Schema, Caching, Lese-/Schreibpfade mit Berechnungen, Skalierung, Multi-Region/CAP, TTL/Rückgewinnung, Fehlermodi (5 Szenarien) und Kompromisse. Der Abschnitt über operative Überlegungen fügt nützliche ergänzende Details hinzu.

Trade-off-Analyse

Gewichtung 20%

Antwort A präsentiert fünf substanzielle Kompromisse mit klar abgelehnten Alternativen und spezifischer Begründung: DynamoDB vs. RDBMS vs. Cassandra, zufälliges Token vs. sequenziell vs. Hash, Active-Active vs. Active-Passive, Rückgewinnung vs. niemals Wiederverwendung und Edge-Caching vs. nur Origin. Jede Ablehnung wird mit konkreter technischer Begründung erklärt.

Skalierbarkeit und Zuverlassigkeit

Gewichtung 20%

Antwort A liefert eine konkrete 10-fache Skalierungsanalyse: Spitzenlesevorgänge skalieren auf 200.000/Sek., DB-Lesevorgänge bei einer Fehlerrate von 10 % erreichen 20.000/Sek., Redis skaliert auf Hunderte von Shards. Autoskalierung, DynamoDB On-Demand und Redis-Cluster-Resharding werden alle angesprochen. Fünf Fehlerszenarien mit spezifischen Wiederherstellungsmechanismen werden beschrieben, einschließlich ID-Generator-Fehlern und Backlogs im Event-Stream.

Klarheit

Gewichtung 10%

Antwort A ist gut organisiert mit klaren Abschnittsüberschriften und einem logischen Fluss von der Architektur bis zu den operativen Überlegungen. Die Zusammenfassung am Ende rundet das Design effektiv ab. Einige Abschnitte sind dicht, bleiben aber lesbar. Die textliche Beschreibung des Architekturdiagramms ist klar.

Bewertungsmodelle Google Gemini 2.5 Pro

Gesamtpunktzahl

Gesamtkommentar

Antwort A bietet ein herausragendes und umfassendes Systemdesign. Ihre wichtigsten Stärken liegen in der tiefgehenden quantitativen Analyse, die sowohl die Basis- als auch die 10-fache Spitzen-Durchsatzrate berechnet, um die Komponentenbemessung zu informieren. Die architektonischen Entscheidungen, insbesondere die zustandslose Zufallsschlüsselerzeugung mit datenbankgestützter Kollisionsauflösung und der hybride TTL/Wiederherstellungsmechanismus, sind sowohl elegant als auch betrieblich robust. Die Fehleranalyse ist gründlich und deckt fünf verschiedene Szenarien ab. Das gesamte Design ist kohärent, praktisch und zeigt ein ausgereiftes Verständnis für den Aufbau verteilter Systeme in großem Maßstab.

Bewertungsdetails anzeigen ▼

Architekturqualitat

Gewichtung 30%

Die Architektur ist außergewöhnlich gut durchdacht. Die Wahl einer zustandslosen, dezentralen Schlüsselerzeugungsmethode (CSPRNG + DB bedingte Einfügung) ist einfacher und robuster als ein dedizierter Dienst. Der Wiederherstellungsmechanismus, der DB-TTL mit einer aktiven Pipeline und einer Tombstone-Periode kombiniert, ist eine sehr ausgereifte und praktische Lösung, die ineffiziente Tabellenscans vermeidet.

Vollstandigkeit

Gewichtung 20%

100

Die Antwort ist vollkommen vollständig und geht detailliert und strukturiert auf alle zehn Aufzählungspunkte der Aufforderung ein. Jeder Abschnitt ist gründlich und beantwortet direkt die entsprechende Anforderung.

Trade-off-Analyse

Gewichtung 20%

Die Abwägungsanalyse ist ausgezeichnet und zeigt eine tiefe Designreife. Sie deckt fünf verschiedene und kritische Designentscheidungen ab, erläutert klar den gewählten Weg, die verworfenen Alternativen und die fundierte Begründung hinter jeder Wahl. Die Begründung ist spezifisch und bezieht sich auf die Kernanforderungen des Projekts.

Skalierbarkeit und Zuverlassigkeit

Gewichtung 20%

Diese Antwort zeichnet sich durch ihre Analyse der Skalierbarkeit und Zuverlässigkeit aus. Sie liefert konkrete Durchsatzberechnungen für Basis- und 10-fache Wachstumsszenarien, was ein wichtiges Unterscheidungsmerkmal ist. Die Fehleranalyse ist umfassend und deckt fünf spezifische und realistische Szenarien mit klaren Wiederherstellungsplänen ab. Das Active-Active, Eventually-Consistent Multi-Region-Modell ist für die geforderten Verfügbarkeitsanforderungen gut begründet.

Klarheit

Gewichtung 10%

Die Antwort ist außergewöhnlich klar, gut strukturiert und leicht verständlich. Sie verwendet Überschriften, die direkt den Anforderungen der Aufforderung entsprechen, und der Fluss von der übergeordneten Architektur zu detaillierten Implementierungsentscheidungen ist logisch und kohärent.

Antwort B: Google Gemini 2.5 Flash

Vollstandige Antwort anzeigen ▼

Architekturübersicht: Die Architektur ist auf hohe Verfügbarkeit, Skalierbarkeit und geringe Latenz ausgelegt und nutzt einen Microservices-Ansatz. Zu den Schlüsselkomponenten gehören: 1. **Load Balancer (z. B. AWS ELB/GCP Load Balancer/Nginx)**: Verteilen eingehenden Datenverkehr auf Service-Instanzen. 2. **API Gateway (z. B. AWS API Gateway/Kong)**: Verarbeitet API-Anfragen, Authentifizierung, Ratenbegrenzung und leitet Datenverkehr an die entsprechenden Backend-Services. 3. **Shortening Service (Schreibpfad)**: Ein zustandsloser Microservice, der für die Verarbeitung von Anfragen zur Erstellung neuer kurzer URLs zuständig ist. Er interagiert mit dem Key Generation Service und der Datenbank. 4. **Redirect Service (Lesepfad)**: Ein hochoptimierter, zustandsloser Microservice, der für die Auflösung kurzer URLs zu langen URLs und die Durchführung der HTTP 301/302-Umleitung zuständig ist. Er stützt sich stark auf Caching. 5. **Key Generation Service**: Ein dedizierter Dienst, der für die Vorabgenerierung und Verwaltung eines Pools eindeutiger, zufälliger kurzer URL-Schlüssel zuständig ist. Er sorgt für Nicht-Erkennbarkeit und vermeidet Kollisionen. 6. **Datenbank (z. B. Apache Cassandra)**: Der primäre persistente Speicher für Short-URL-Mappings. Ausgewählt wegen seines hohen Schreib-/Lese-Durchsatzes, seiner horizontalen Skalierbarkeit und seiner Multi-Region-Replikationsfähigkeiten. 7. **Verteilter Cache (z. B. Redis Cluster)**: Speichert häufig abgerufene Short-URL-Mappings, um die Datenbanklast zu reduzieren und eine geringe Redirect-Latenz zu erreichen. 8. **Message Queue (z. B. Apache Kafka/AWS SQS)**: Wird für die asynchrone Kommunikation zwischen Services verwendet, z. B. zum Veröffentlichen von Ereignissen für Analysen, Cache-Invalidierung und URL-Ablauf. 9. **Analytics Service**: Verbraucht Ereignisse aus der Message Queue, um Klickzahlen zu verfolgen, Berichte zu erstellen und Nutzungsmuster zu überwachen. 10. **Expiration & Reclamation Service**: Ein Hintergrund-Worker-Service, der für die Identifizierung abgelaufener URLs, deren Kennzeichnung und die Rückgabe ihrer Schlüssel an den Pool des Key Generation Service zur Wiederverwendung zuständig ist. 11. **CDN (Content Delivery Network, z. B. Cloudflare/Akamai)**: Optional, aber dringend empfohlen für das Caching von Redirects am Edge, um die Latenz und die Last auf den Origin-Servern für globale Benutzer weiter zu reduzieren. Interaktionen: * **Schreibpfad**: Benutzer -> Load Balancer -> API Gateway -> Shortening Service -> Key Generation Service (holt Schlüssel) -> Datenbank (schreibt Mapping) -> Message Queue (veröffentlicht 'new_url'-Ereignis) -> Cache (aktualisiert/schreibt durch). * **Lesepfad**: Benutzer -> Load Balancer -> CDN (wenn Treffer, leitet weiter) -> Redirect Service (prüft lokalen Cache -> verteilten Cache -> Datenbank) -> Redirect. URL-Shortening-Algorithmus und Schlüsselgenerierungsstrategie: Um Nicht-Erkennbarkeit und Eindeutigkeit zu gewährleisten und das 7-Zeichen-Limit einzuhalten, wird eine Vorabgenerierungsstrategie angewendet: 1. **Key Generation Service**: Dieser Dienst generiert kontinuierlich zufällige alphanumerische Zeichenfolgen von 7 Zeichen (z. B. unter Verwendung eines kryptografisch sicheren Pseudozufallszahlengenerators). Der Zeichensatz umfasst `a-z`, `A-Z`, `0-9`, insgesamt 62 Zeichen. Eine 7-Zeichen-Zeichenfolge ermöglicht 62^7 eindeutige Schlüssel, was ungefähr 3,5 Billionen entspricht und damit die Anforderung von 100 Millionen URLs/Monat weit übertrifft. 2. **Eindeutigkeitsprüfung**: Bevor jeder generierte Schlüssel dem Pool hinzugefügt wird, wird seine Eindeutigkeit anhand der Datenbank (oder eines dedizierten Speichers für eindeutige Schlüssel) überprüft. Dies ist eine einmalige Prüfung während der Generierung, nicht während der Anfragen zur Verkürzung. 3. **Schlüsselpool**: Eindeutige Schlüssel werden in einem hochverfügbaren, schnell zugänglichen Pool gespeichert (z. B. einem Redis-Set oder einer dedizierten Tabelle in Cassandra mit einem 'status'-Feld wie 'available'). Der Key Generation Service unterhält einen großen Puffer (z. B. mehrere Milliarden Schlüssel), um sicherzustellen, dass Schlüssel jederzeit verfügbar sind. 4. **Verkürzungsprozess**: Wenn ein Benutzer eine neue kurze URL anfordert, fordert der Shortening Service einen Schlüssel vom Key Generation Service an. Der Key Generation Service zieht atomar einen verfügbaren Schlüssel aus seinem Pool, markiert ihn als 'in use' und gibt ihn zurück. Dies vermeidet Konflikte bei hoher Schreiblast. 5. **Kollisionsvermeidung**: Durch die Vorabgenerierung und atomare Zuweisung eindeutiger Schlüssel werden Kollisionen während der eigentlichen Verkürzungsanfrage praktisch eliminiert. Die Datenbank erzwingt außerdem eine eindeutige Einschränkung für den `short_url_key` als letzte Sicherheitsmaßnahme. Datenbankschema und Wahl der Speichertechnologie: Datenbankwahl: **Apache Cassandra** (oder AWS DynamoDB als verwaltete Alternative). Begründung: * **Hoher Schreib-/Lese-Durchsatz**: Cassandra ist für Operationen mit hohem Volumen und geringer Latenz ausgelegt, perfekt für das Lese-Schreib-Verhältnis von 100:1 und Milliarden von Lesevorgängen. * **Horizontale Skalierbarkeit**: Lässt sich einfach durch Hinzufügen weiterer Knoten skalieren, wodurch Daten und Last auf dem Cluster verteilt werden. * **Hohe Verfügbarkeit und Fehlertoleranz**: Daten werden über mehrere Knoten und Rechenzentren repliziert, um den kontinuierlichen Betrieb auch bei Knotenausfällen zu gewährleisten. * **Eventual Consistency**: Für diesen Anwendungsfall akzeptabel. Obwohl eine neue URL Millisekunden zur Replikation über Regionen hinweg benötigen kann, beeinträchtigt dies die Kernfunktionalität nicht. * **Einfache Schlüssel-Wert-Abfragen**: Das primäre Zugriffsmuster ist `short_url_key` zu `long_url`, bei dem Cassandra hervorragend abschneidet. Schema (Keyspace: `url_shortener`, Tabelle: `short_urls`): ``` CREATE TABLE url_shortener.short_urls ( short_url_key text PRIMARY KEY, -- Partition Key, 7 alphanumerische Zeichen long_url text, user_id text, -- Optional, für benutzerspezifische URLs created_at timestamp, expires_at timestamp, click_count counter, -- Cassandra Counter-Typ für atomare Inkremente status text -- 'active', 'expired', 'reclaimed' ); ``` Caching-Strategie und Cache-Invalidierungsansatz: Caching ist entscheidend, um die Redirect-Latenz von <10ms zu erreichen und 10 Milliarden Redirects/Monat zu bewältigen. Strategie: 1. **Mehrstufiges Caching**: * **CDN (Edge Cache)**: Cacht Redirects an geografisch verteilten Points of Presence. Dies ist die erste Verteidigungslinie für Leseanfragen. * **Verteilter Cache (Redis Cluster)**: Ein zentraler Hochleistungs-Cache, der `short_url_key` zu `long_url`-Mappings speichert. Jeder Eintrag speichert auch `expires_at`. * **In-Memory-Cache**: Jede Redirect Service-Instanz unterhält einen kleinen, schnellen In-Memory-Cache für die heißesten URLs. 2. **Read-Through**: Wenn der Redirect Service eine Anfrage erhält, prüft er zuerst seinen In-Memory-Cache, dann den Redis Cluster. Wenn nichts gefunden wird, ruft er Daten aus Cassandra ab, speichert das Mapping in Redis und seinem lokalen Cache und leitet dann weiter. 3. **Write-Through**: Wenn eine neue URL gekürzt wird, schreibt der Shortening Service das Mapping in Cassandra und dann sofort in den Redis Cluster. Cache-Invalidierung: 1. **TTL-basierte Ablaufzeit**: Cache-Einträge in Redis und In-Memory-Caches haben eine konfigurierbare TTL (z. B. 5 Minuten oder ausgerichtet an `expires_at` der URL). Dies behandelt die Eventual Consistency und stellt sicher, dass veraltete Daten nicht unbegrenzt bestehen bleiben. 2. **Explizite Invalidierung**: Wenn eine URL abläuft oder vom Expiration & Reclamation Service zurückgefordert wird, wird ein Ereignis an die Message Queue gesendet. Cache-Invalidierungs-Worker verbrauchen dieses Ereignis und löschen explizit den entsprechenden Eintrag aus dem Redis Cluster. CDN-Caches werden über API-Aufrufe oder durch Setzen geeigneter `Cache-Control`-Header mit kurzer `max-age` für Redirects invalidiert. Read Path und Write Path mit Durchsatzberechnungen: Annahmen: 1 Monat = 2.592.000 Sekunden. Schreibpfad (100 Millionen neue URL-Verkürzungen pro Monat): * **Durchschnittlicher Durchsatz**: 100.000.000 URLs / 2.592.000 Sekunden ≈ 38,6 Schreibvorgänge/Sekunde. * **Spitzendurchsatz**: Bei einer Spitzenlast von 3x dem Durchschnitt, Auslegung für ~120 Schreibvorgänge/Sekunde. * **Ablauf**: Load Balancer -> API Gateway -> Shortening Service (fordert Schlüssel vom Key Generation Service an, schreibt in Cassandra, schreibt in Redis, veröffentlicht Ereignis an Kafka). * **Komponenten**: Mehrere Instanzen von Shortening Service, Key Generation Service, Cassandra-Knoten, Redis-Knoten, Kafka-Broker. * **Latenzziel**: Unter 100 ms für Schreibvorgänge (weniger kritisch als Lesevorgänge). Lesepfad (10 Milliarden Redirects pro Monat): * **Durchschnittlicher Durchsatz**: 10.000.000.000 Redirects / 2.592.000 Sekunden ≈ 3.858 Lesevorgänge/Sekunde. * **Spitzendurchsatz**: Bei einer Spitzenlast von 3x dem Durchschnitt, Auslegung für ~12.000 Lesevorgänge/Sekunde. * **Ablauf**: Benutzer -> CDN (wenn Treffer, leitet weiter) -> Load Balancer -> Redirect Service (prüft In-Memory-Cache -> Redis Cluster -> Cassandra) -> Redirect. * **Cache-Trefferquote**: Ziel >95% Cache-Trefferquote (CDN + Redis), um Cassandra zu entlasten. * **Effektive DB-Lesevorgänge**: 12.000 Lesevorgänge/Sek. * 5% (Cache-Fehlrate) = 600 Lesevorgänge/Sekunde an Cassandra. * **Latenzziel**: Unter 10 ms im 95. Perzentil. * **Komponenten**: Zahlreiche Instanzen von Redirect Service, Redis Cluster-Knoten, Cassandra-Knoten. CDN spielt eine entscheidende Rolle. Skalierungsstrategie: 1. **Horizontale Skalierung (Zustandslose Services)**: Alle zustandslosen Services (API Gateway, Shortening Service, Redirect Service, Key Generation Service, Analytics Service, Expiration & Reclamation Service) werden als mehrere Instanzen hinter Load Balancern bereitgestellt. Sie können durch Hinzufügen weiterer Instanzen basierend auf CPU-Auslastung, Speicher oder Anforderungswarteschlangentiefe skaliert werden (z. B. mit Kubernetes HPA oder AWS Auto Scaling Groups). 2. **Datenbankskalierung (Cassandra)**: Cassandra skaliert horizontal durch Hinzufügen weiterer Knoten zum Cluster. Daten werden automatisch neu verteilt. 3. **Cache-Skalierung (Redis Cluster)**: Redis Cluster bietet Sharding und Replikation, wodurch er horizontal durch Hinzufügen weiterer Master- und Replikaknoten skaliert werden kann. 4. **Message Queue-Skalierung (Kafka)**: Kafka ist von Natur aus skalierbar und ermöglicht einen höheren Durchsatz durch Hinzufügen weiterer Broker und Partitionen. 5. **CDN**: Entlastet einen erheblichen Teil des Leseverkehrs von den Origin-Servern und skaliert effektiv den Lesepfad global. 6. **Microservices**: Die modulare Architektur ermöglicht es, einzelne Services basierend auf ihren spezifischen Lastanforderungen unabhängig zu skalieren. Multi-Region-Bereitstellung und Datenkonsistenzmodell: Um eine Verfügbarkeit von 99,9 % und Disaster Recovery zu erreichen, wird der Dienst in einer Active-Active-Konfiguration über mindestens zwei geografische Regionen (z. B. US-Ost und EU-West) bereitgestellt. Bereitstellung: * Jede Region beherbergt einen vollständigen, unabhängigen Stack aller Dienste (Load Balancer, API Gateway, Shortening/Redirect Services, Key Generation Service, Cassandra Cluster, Redis Cluster, Kafka Cluster usw.). * Ein globaler Load Balancer (z. B. AWS Route 53 mit latenzbasierter Weiterleitung oder ein globaler Traffic Manager) leitet Benutzer zur nächstgelegenen gesunden Region. Datenkonsistenzmodell: * **Cassandra Multi-Datacenter-Replikation**: Cassandras `NetworkTopologyStrategy` wird verwendet, um Daten asynchron zwischen den regionalen Clustern zu replizieren. Jede Region behält eine vollständige Kopie der Daten. * **Schreibvorgänge**: Schreibvorgänge werden typischerweise mit `LOCAL_QUORUM`-Konsistenz innerhalb der primären Region für geringe Latenz durchgeführt. Cassandras integrierte Replikation sorgt für Eventual Consistency über Regionen hinweg. Eine neue kurze URL, die in Region A erstellt wurde, wird schließlich nach Region B repliziert. * **Lesevorgänge**: Lesevorgänge werden ebenfalls typischerweise mit `LOCAL_QUORUM`-Konsistenz für geringe Latenz durchgeführt und bedienen Daten aus dem Cassandra-Cluster oder Cache der lokalen Region. Wenn ein Schlüssel lokal nicht gefunden wird (z. B. aufgrund von Replikationsverzögerungen für eine sehr neue URL), könnte ein Fallback auf einen Cross-Region-Lesevorgang implementiert werden, dies würde jedoch höhere Latenz verursachen. Angesichts der Leseintensität und des Caches ist dies selten. Kompromisse (CAP-Theorem): * **Gewählt**: Priorisierung von **Verfügbarkeit** und **Partitionstoleranz** gegenüber starker **Konsistenz** über Regionen hinweg. * **Begründung**: Für einen URL-Shortening-Dienst ist es wichtiger, dass der Dienst immer verfügbar und schnell ist, auch wenn eine neu erstellte URL einige Millisekunden benötigt, um global zugänglich zu sein. Starke Konsistenz über geografisch verteilte Rechenzentren hinweg würde inakzeptable Schreiblatenz und Komplexität einführen. Eventual Consistency ist ein geeigneter Kompromiss. TTL-Ablauf und URL-Rückgewinnungsmechanismus: 1. **Ablauf**: Der Zeitstempel `expires_at` in der Tabelle `short_urls` wird verwendet. Der Expiration & Reclamation Service (eine Reihe von Hintergrund-Workern) scannt periodisch die Tabelle `short_urls` nach Einträgen, bei denen `expires_at` in der Vergangenheit liegt und `status` 'active' ist. * Nach Identifizierung einer abgelaufenen URL aktualisiert der Dienst ihren `status` in Cassandra auf 'expired'. * Anschließend wird ein 'url_expired'-Ereignis an die Message Queue gesendet, was die Cache-Invalidierung für diesen `short_url_key` in Redis und CDN auslöst. 2. **Rückgewinnung**: Nach einer konfigurierbaren Kulanzfrist (z. B. 24-48 Stunden) nach dem Ablauf (um sicherzustellen, dass alle Caches geleert sind und keine laufenden Redirects betroffen sind), identifiziert der Expiration & Reclamation Service URLs mit dem `status` 'expired', die ihre Kulanzfrist überschritten haben. * Anschließend wird ihr `status` auf 'reclaimable' aktualisiert. * Der `short_url_key` wird dann wieder dem Pool verfügbarer Schlüssel des Key Generation Service hinzugefügt. Dies stellt sicher, dass der 7-Zeichen-Schlüsselraum im Laufe der Zeit effizient wiederverwendet wird. * Eine abschließende Prüfung auf Eindeutigkeit vor der Rückgabe in den Pool kann durchgeführt werden, obwohl das Design des Key Generation Service echte Kollisionen verhindern sollte. Fehlermodi und Wiederherstellung: 1. **Datenbankknotenausfall (z. B. Absturz eines Cassandra-Knotens)**: * **Erkennung**: Überwachungssysteme erkennen die Nichterreichbarkeit des Knotens oder hohe Fehlerraten. * **Wiederherstellung**: Cassandras verteilte Architektur mit einem Replikationsfaktor (RF) von 3 (oder höher) gewährleistet Datenredundanz. Wenn ein Knoten ausfällt, bedienen andere Replikate die Daten. Der Cluster bleibt betriebsbereit. Der ausgefallene Knoten kann automatisch ersetzt oder manuell wieder online gebracht werden. Kein Datenverlust, minimale Serviceunterbrechung. 2. **Ausfall des Key Generation Service**: * **Erkennung**: Health Checks und Überwachung erkennen die Nichtverfügbarkeit des Dienstes oder die Erschöpfung des Schlüsselpools. * **Wiederherstellung**: Der Key Generation Service wird mit mehreren Instanzen bereitgestellt. Wenn eine ausfällt, übernehmen andere. Wenn der gesamte Dienst ausfällt, schlagen neue URL-Verkürzungsanfragen vorübergehend fehl, da sie keinen eindeutigen Schlüssel erhalten können. Bestehende Redirects funktionieren jedoch weiterhin normal. Auto-Scaling-Gruppen starten neue Instanzen. Ein großer vorab generierter Schlüsselpuffer (Milliarden von Schlüsseln) reduziert die Auswirkungen vorübergehender Ausfälle erheblich. 3. **Ausfall des Cache-Clusters (z. B. Redis Cluster-Ausfall)**: * **Erkennung**: Überwachung erkennt die Nichtverfügbarkeit von Redis-Knoten oder -Clustern. * **Wiederherstellung**: Der Redirect Service greift auf die Cassandra-Datenbank zurück, wenn der Cache nicht verfügbar ist. Dies führt zu einer erhöhten Redirect-Latenz (von <10ms auf potenziell 50-100ms) und einer höheren Last auf Cassandra, aber der Dienst bleibt voll funktionsfähig (eingeschränkte Leistung). Redis Cluster mit Replikation bietet hohe Verfügbarkeit und mildert vollständige Cluster-Ausfälle. 4. **Ausfall einer gesamten Region**: * **Erkennung**: Globaler Load Balancer (z. B. Route 53 Health Checks) erkennt, dass alle Dienste in einer Region nicht fehlerfrei sind. * **Wiederherstellung**: Der globale Load Balancer leitet automatisch den gesamten Datenverkehr zur gesunden sekundären Region um. Benutzer können während des Failovers einen kurzen Latenzanstieg erleben, aber der Dienst bleibt verfügbar. Die Datenkonsistenz kann leicht hinterherhinken, aber das System ist darauf ausgelegt, Eventual Consistency zu tolerieren. Getroffene Schlüsselkompromisse und erwogene Alternativen: 1. **Konsistenz vs. Verfügbarkeit/Latenz (CAP-Theorem)**: * **Gewählt**: Eventual Consistency für die plattformübergreifende Datenreplikation und hohe Verfügbarkeit/geringe Latenz bei Lesevorgängen. * **Abgelehnt**: Starke Konsistenz über Regionen hinweg. * **Begründung**: Starke Konsistenz würde erhebliche Latenz für Schreibvorgänge und plattformübergreifende Lesevorgänge einführen, was für einen hochvolumigen, latenzarmen Redirect-Dienst inakzeptabel ist. Wenige Millisekunden Inkonsistenz für ein neues URL-Mapping sind ein geringer Kompromiss im Vergleich zu den Vorteilen hoher Verfügbarkeit und Leistung. 2. **Schlüsselgenerierungsstrategie (Vorabgeneriert vs. On-the-fly-Hashing/Sequenziell)**: * **Gewählt**: Vorabgenerierte zufällige alphanumerische Schlüssel über einen dedizierten Dienst. * **Abgelehnt**: Hashing der langen URL (z. B. MD5, SHA-256 gekürzt) oder Verwendung eines Base-62-Encoders auf einer automatisch inkrementierenden ID. * **Begründung**: Hashing kann zu Kollisionen führen (insbesondere bei einem 7-Zeichen-Limit), was eine komplexe Kollisionslösungslogik erfordert und den Schreibpfad verlangsamt und komplexer macht. Base-62 auf automatisch inkrementierenden IDs macht URLs sequenziell und leicht zu erraten, was eine Schlüsselanforderung verletzt. Vorabgenerierung gewährleistet Eindeutigkeit, Nicht-Erkennbarkeit und schnelle Schlüsselabfrage während des Schreibens, was den Verkürzungsprozess vereinfacht. 3. **Datenbankwahl (NoSQL vs. Relational SQL)**: * **Gewählt**: Apache Cassandra (NoSQL). * **Abgelehnt**: PostgreSQL/MySQL (Relational SQL). * **Begründung**: Relationale Datenbanken haben Schwierigkeiten mit dem extremen Lese-/Schreibdurchsatz und den Anforderungen an die horizontale Skalierbarkeit dieses Dienstes ohne erhebliche Sharding-Komplexität. NoSQL-Datenbanken wie Cassandra sind speziell für diese Skalierung, hohe Verfügbarkeit und Leistung ausgelegt, insbesondere für einfache Schlüssel-Wert-Abfragen, was das primäre Zugriffsmuster ist. 4. **TTL-Implementierung (Hintergrunddienst vs. Datenbank-TTL)**: * **Gewählt**: Dedizierter Expiration & Reclamation Service, der `expires_at` scannt. * **Abgelehnt**: Sich ausschließlich auf die Datenbank-TTL verlassen (z. B. die integrierte TTL von Cassandra). * **Begründung**: Obwohl die Datenbank-TTL Daten automatisch ablaufen lassen kann, erleichtert sie nicht die kontrollierte Rückgewinnung des `short_url_key` in einen wiederverwendbaren Pool oder die Auslösung expliziter Cache-Invalidierungen. Ein dedizierter Dienst bietet eine granularere Kontrolle über den gesamten Lebenszyklus, einschließlich der Kulanzfrist und der sicheren Schlüsselwiederverwendung.

Ergebnis

Siegstimmen

0 / 3

Durchschnittsscore

Bewertungsmodelle OpenAI GPT-5.2

Gesamtpunktzahl

Gesamtkommentar

Deckt die meisten Abschnitte ab und ist gut strukturiert, mit korrekter Keyspace-Mathematik und vernünftigen Baseline-QPS-Berechnungen. Die Diskussion über die Multi-Region-Cassandra-Konsistenz (LOCAL_QUORUM, asynchrone Replikation) und die Kompromisse sind ordentlich. Es bleibt jedoch auf einer höheren Ebene bei der Kapazitätsplanung und Latenz (wenige konkrete Größenangaben über QPS hinaus), und mehrere Designentscheidungen sind im großen Maßstab fragwürdig oder unpraktisch (Vorabgenerierung und Speicherung von „mehreren Milliarden“ Schlüsseln; Eindeutigkeitsprüfungen generierter Schlüssel gegen die DB; periodische vollständige Tabellenscans zur Verfallszeit). Cache-Invalidierung und TTL/Rückgewinnung werden beschrieben, es mangelt jedoch an Details zur Effizienz und Korrektheit (z. B. wie man Cassandra ohne Hotspots scannt, wie man teure Scans vermeidet). Fehlerszenarien sind vorhanden, aber Wiederherstellungsschritte können generisch sein und einige Latenzansprüche bei Cache-Ausfällen sind optimistisch/vage.

Bewertungsdetails anzeigen ▼

Architekturqualitat

Gewichtung 30%

Vernünftige Zerlegung in Microservices und Erwähnung von CDN/Cache/DB/Queue, aber die Interaktionen sind generischer und einige Komponenten (Key-Pool-Service, Verfalls-Scanner) sind betrieblich unterdefiniert.

Vollstandigkeit

Gewichtung 20%

Behandelt alle Bereiche, aber mehrere sind weniger explizit/tief (z. B. detaillierte Skalierungszahlen, Mechanismen zur Cache-Invalidierung, effiziente Implementierung des Verfalls). Auf Abschnittsebene immer noch weitgehend vollständig.

Trade-off-Analyse

Gewichtung 20%

Enthält CAP und einige Alternativen, aber die Begründung ist eher lehrbuchartig und weniger an betriebliche Einschränkungen gebunden (z. B. Machbarkeit/Kosten der Schlüsselvorabgenerierung, Scannen nach TTL).

Skalierbarkeit und Zuverlassigkeit

Gewichtung 20%

Skalierbarkeit wird meist qualitativ beschrieben; Zuverlässigkeit/Fehlerbehandlung ist vorhanden, aber einige Annahmen sind wackelig (großer Schlüsselpool, Verfallsscans, optimistische Latenz bei Cache-Ausfällen). Die Multi-Region-Geschichte ist ordentlich, aber weniger End-to-End.

Klarheit

Gewichtung 10%

Sehr lesbar und strukturiert, mit einfachen Abschnitten und Flussbeschreibungen; weniger Details, aber leicht zu verfolgen.

Bewertungsmodelle Anthropic Claude Sonnet 4.6

Gesamtpunktzahl

Gesamtkommentar

Antwort B ist ein solides, gut organisiertes Design, das die meisten erforderlichen Abschnitte abdeckt, aber in mehreren Schlüsselbereichen zu kurz kommt. Die Durchsatzberechnungen verwenden einen 3-fachen Spitzenfaktor ohne Begründung und sind weniger detailliert als Antwort A (z. B. keine Dimensionierung von Redis-Shards, keine DB-Lesekapazitätszahlen). Die Schlüsselgenerierungsstrategie basiert auf einem vorab generierten Pool, der in Redis gespeichert ist, was einen einzigen Komplexitätspunkt und einen potenziellen Engpass einführt, der nicht vollständig behoben wird. Das Schema verwendet einen Cassandra-Zählertyp für click_count, was eine vernünftige Wahl ist, aber nicht in Bezug auf Kompromisse diskutiert wird. Die CAP-Begründung ist vorhanden, aber etwas generisch. Die Fehlerszenarien sind vernünftig, aber weniger spezifisch – zum Beispiel erwähnt das Szenario für den Ausfall des Caches eine Latenz von 50-100 ms, ohne zu erklären, wie diese abgeleitet wurde. Der TTL-Wiederherstellungsmechanismus ist weniger detailliert als Antwort A, insbesondere in Bezug auf die Grabstein-/Schonfrist und die Sicherheit der Wiederverwendung. Der Abschnitt über Kompromisse ist angemessen, aber oberflächlicher. Die Antwort ist gut geschrieben und strukturiert, aber es fehlt ihr die quantitative Tiefe und die architektonische Spezifität von Antwort A.

Bewertungsdetails anzeigen ▼

Architekturqualitat

Gewichtung 30%

Antwort B beschreibt eine vernünftige Architektur mit ähnlichen Komponenten, aber der vorab generierte Schlüsselpool in Redis führt zu einem potenziellen Engpass (atomisches Pop unter hoher Schreiblast), der nicht vollständig analysiert wird. Das Schema verwendet einen Cassandra-Zählertyp, was eine gültige, aber nicht triviale Wahl ist, die nicht eingehend diskutiert wird. Die Architektur ist kohärent, aber weniger rigoros analysiert.

Vollstandigkeit

Gewichtung 20%

Antwort B deckt alle zehn Aufzählungspunkte ab, jedoch mit geringerer Tiefe in mehreren Bereichen. Die Durchsatzberechnungen sind vorhanden, aber weniger detailliert. Der Wiederherstellungsmechanismus wird beschrieben, es fehlt jedoch die Analyse der Sicherheit von Grabsteinen/Schonfristen. Vier Fehlerszenarien werden anstelle der mindestens drei bereitgestellt, was angemessen ist, aber sie sind weniger spezifisch als die von Antwort A.

Trade-off-Analyse

Gewichtung 20%

Antwort B präsentiert vier Kompromisse, die vernünftig, aber etwas generisch sind. Die CAP-Begründung ist vorhanden, aber kurz. Der Kompromiss bei der Schlüsselgenerierung lehnt Hashing und sequentielle IDs korrekt ab, diskutiert aber nicht die Risiken des Engpasses des vorab generierten Pool-Ansatzes selbst. Der TTL-Kompromiss ist der originellste, aber es fehlt ihm an Tiefe bezüglich der Risiken des gewählten Ansatzes.

Skalierbarkeit und Zuverlassigkeit

Gewichtung 20%

Antwort B adressiert horizontale Skalierung für alle Dienste und erwähnt die Hinzufügung von Cassandra-Knoten und die Shardierung von Redis Cluster, liefert aber keine konkreten Zahlen für das 10-fache Szenario. Die Fehlerszenarien sind angemessen (4 Szenarien), aber weniger spezifisch – die Schätzung der Latenz bei Cache-Ausfall von 50-100 ms wird ohne Herleitung angegeben, und die Wiederherstellung nach einem Regionsausfall wird allgemein beschrieben.

Klarheit

Gewichtung 10%

Antwort B ist ebenfalls gut organisiert und verwendet effektiv nummerierte Listen und fette Überschriften. Die Sprache ist klar und zugänglich. Die Verwendung von Codeblöcken für das Schema ist jedoch eine geringfügige Formatierungsentscheidung, die gut funktioniert. Die Gesamtstruktur ist etwas weniger detailliert als Antwort A, aber ebenso lesbar.

Bewertungsmodelle Google Gemini 2.5 Pro

Gesamtpunktzahl

Gesamtkommentar

Antwort B präsentiert ein sehr starkes und vollständiges Systemdesign, das alle Anforderungen der Aufgabenstellung erfüllt. Sie schlägt eine gültige Architektur mit einem dedizierten Schlüsselgenerierungsdienst und einem Hintergrundarbeiter für die Rückgewinnung von URLs vor. Die Erklärungen sind klar und die Technologieauswahl ist gut begründet. In einigen Bereichen liegt sie jedoch leicht hinter Antwort A zurück. Die quantitative Analyse für eine 10-fache Skalierung ist weniger detailliert, und einige Designentscheidungen, wie der Pool vorab generierter Schlüssel und der Dienst zur Rückgewinnung durch Tabellenscans, führen zu mehr betrieblicher Komplexität und potenziellen Engpässen im Vergleich zu den von A gewählten Alternativen.

Bewertungsdetails anzeigen ▼

Architekturqualitat

Gewichtung 30%

Die Architektur ist sehr gut, aber die Einführung eines dedizierten Schlüsselgenerierungsdienstes fügt eine zustandsbehaftete Komponente hinzu, die zu einem Engpass oder einem Single Point of Failure werden kann, wenn sie nicht sorgfältig verwaltet wird. Ebenso ist der Rückgewinnungsdienst, der auf dem Scannen der primären Tabelle basiert, bei massiver Skalierung weniger effizient als die Nutzung nativer Datenbankfunktionen wie TTL-Streams oder Indizes.

Vollstandigkeit

Gewichtung 20%

100

Die Antwort ist vollkommen vollständig. Sie behandelt systematisch jeden der zehn geforderten Abschnitte der Aufgabenstellung und liefert detaillierte Informationen für jeden.

Trade-off-Analyse

Gewichtung 20%

Die Abwägung von Kompromissen ist sehr stark und deckt vier Schlüsselbereiche ab, darunter Konsistenz, Schlüsselgenerierung und Datenbankauswahl. Die Begründungen sind klar und logisch. Die Diskussion über die Ablehnung von Datenbank-TTL zugunsten eines dedizierten Dienstes ist interessant, obwohl der gewählte Ansatz eigene Skalierbarkeitskompromisse hat, die weiter hätten untersucht werden können.

Skalierbarkeit und Zuverlassigkeit

Gewichtung 20%

Die Skalierbarkeits- und Zuverlässigkeitsaspekte sind gut abgedeckt. Das Design verwendet Standardmuster für horizontale Skalierung und eine solide Multi-Region-Strategie. Die quantitative Analyse für ein 10-faches Wachstum ist jedoch weniger detailliert als in Antwort A. Die Fehleranalyse ist gut und deckt vier Szenarien ab, aber die Abhängigkeit des Designs von einem dedizierten Schlüssel-Service führt zu einem einzigartigen Fehlerpunkt.

Klarheit

Gewichtung 10%

Die Antwort ist sehr klar und gut organisiert. Die Verwendung von Überschriften und Aufzählungspunkten macht das komplexe Design leicht verständlich. Die Aufnahme einer `CREATE TABLE`-Anweisung für das Schema ist ein netter Touch für die Klarheit.

Vergleichsuebersicht

Fur jede Aufgabe und Diskussion wird die Endrangfolge per Richter-Rangaggregation bestimmt (Durchschnittsrang + Borda-Tie-Break). Der Durchschnittsscore wird als Referenz angezeigt.

Bewerter: 3

Sieger OpenAI GPT-5 mini

Siegstimmen

3 / 3

Durchschnittsscore

Diese Antwort ansehen

Google Gemini 2.5 Flash

Siegstimmen

0 / 3

Durchschnittsscore

Diese Antwort ansehen

Gesamtbilanz dieser Modellpaarung ansehen

Bewertungsergebnisse

Bewertungsmodelle Google Gemini 2.5 Pro

GPT-5 mini Sieger 96

Gemini 2.5 Flash 90

Warum diese Seite gewann

Antwort A gewinnt aufgrund seiner überlegenen quantitativen Begründung und robusteren, betrieblich effizienteren Designentscheidungen. A liefert detailliertere Durchsatzberechnungen, insbesondere für das 10-fache Skalierungsszenario, was ein tieferes Analyseverständnis zeigt. Darüber hinaus ist die Schlüsselgenerierungsstrategie von A (zustandslos generieren und wiederholen) einfacher und dezentraler als der zustandsbehaftete Schlüsselpool-Service von B. Der URL-Wiederherstellungsmechanismus von A, der native Datenbank-TTL-Funktionen nutzt, ergänzt durch eine Hintergrundpipeline, ist ebenfalls skalierbarer als der Ansatz von B, einen Dienst kontinuierlich die primäre Datenbanktabelle scannen zu lassen.

Bewertungsmodelle Anthropic Claude Sonnet 4.6

GPT-5 mini Sieger 81

Gemini 2.5 Flash 70

Warum diese Seite gewann

Antwort A gewinnt bei quantitativer Argumentation, architektonischer Tiefe und Vollständigkeit. Sie liefert präzisere Durchsatzberechnungen mit begründeten Spitzenfaktoren, konkrete Redis- und DB-Dimensionierungen, einen rigoroseren Token-Generierungsalgorithmus (CSPRNG mit Ablehnungssampling vs. ein vorab generierter Pool mit weniger analysierten Engpässen), spezifischere Mechanismen zur Fehlerwiederherstellung (5 Szenarien vs. 4) und eine detailliertere Pipeline zur TTL-Rückgewinnung mit Tombstone-Semantik. Die interne Konsistenz über die Abschnitte hinweg ist stärker und die Abwägung von Kompromissen ist substanzieller. Antwort B ist kompetent, aber durchweg oberflächlicher in fast jeder Bewertungsdimension.

Bewertungsmodelle OpenAI GPT-5.2

GPT-5 mini Sieger 84

Gemini 2.5 Flash 72

Warum diese Seite gewann

Antwort A gewinnt, da sie über die erforderlichen Punkte hinweg vollständiger und konkreter ist: Sie liefert tiefere quantitative Begründungen (einschließlich Spitzenfaktoren, Cache-Miss-zu-DB-Last und Dimensionierungsbeispiele), einen einfacheren und praktischeren Ansatz zur Schlüsselgenerierung mit atomarer Kollisionsbehandlung, detailliertere Multi-Region-CAP-Begründungen, die an das gewählte Replikationsmodell gebunden sind, und ein robusteres TTL/Wiederherstellungsdesign mit Tombstones und Kulanzzeiten. Antwort B ist kohärent, bleibt aber allgemeiner und enthält weniger realistische Mechanismen (massive vorab generierte Schlüsselpools, DB-Eindeutigkeitsprüfungen während der Generierung und Scan-basierte Ablaufsteuerung) mit schwächeren Kapazitäts- und Betriebdetails.

Design eines URL-Shortening-Dienstes im großen Maßstab

Aufgabenubersicht

Aufgabenstellung

Antworten

Antwort A: OpenAI GPT-5 mini

Antwort B: Google Gemini 2.5 Flash

Vergleichsuebersicht

Bewertungsergebnisse

Verwandte Aufgaben

Schreibe ein Stand-up-Comedy-Set über die Absurditäten des Lebensmitteleinkaufs

Der letzte Kunde in einer schließenden Buchhandlung

Kreative Einnahmequellen für öffentliche Bibliotheken im digitalen Zeitalter

Schreibe einen komödiantischen Dialog zwischen einem Zeitreisenden und einem mittelalterlichen Bauern, in dem versucht wird, moderne Technologie zu erklären

Verfasse eine humorvolle Büro-E-Mail-Kette über einen verschwundenen Hefter

Innovative Nutzungsmöglichkeiten für ausgemusterte Batterien von Elektrofahrzeugen

Auf einen Freund reagieren, der gerade seinen Job verloren hat

Entwurf einer professionellen E-Mail zur Anregung einer abteilungsübergreifenden Zusammenarbeit

Verwandte Links