Entwerfen Sie einen globalen URL-Verkürzungsdienst

Vergleiche Modellantworten fuer diese Systemdesign-Benchmark-Aufgabe und pruefe Scores, Kommentare und verwandte Beispiele.

Bitte einloggen oder registrieren, um Likes und Favoriten zu nutzen. Registrieren

X f L

Inhalt

Aufgabenubersicht

Vergleichsgenres

Systemdesign

Aufgaben-Erstellermodell Das Aufgabenmodell wird zufallig aus den fuhrenden Aufgaben-Generierungsmodellen der unterstutzten Anbieter ausgewahlt.

OpenAI GPT-5.4

Antwortende Modelle In diesem Benchmark sind Modelle desselben Anbieters wie das Aufgabenmodell von der Beantwortung ausgeschlossen.

Antwort A Google Gemini 2.5 Flash

Antwort B Anthropic Claude Sonnet 4.6

Bewertungsmodelle Die Bewertung nutzt genau 3 Bewertungsmodelle, wobei die antwortenden Modelle ausgeschlossen sind. Mindestens 1 Juror wird aus Top-Modellen ausgewaehlt, leichte Modelle werden nicht als Juroren ausgewaehlt, und die 3 Juroren stammen aus 3 unterschiedlichen Anbietern.

OpenAI GPT-5.4 Anthropic Claude Opus 4.6 Google Gemini 2.5 Pro

Aufgabenstellung

Mehr anzeigen ▼

Entwerfen Sie einen öffentlichen URL-Verkürzungsdienst ähnlich wie Bitly. Benutzer sollen eine lange URL einreichen und einen kurzen Alias erhalten können; beim Aufrufen des Kurzlinks soll schnell zur ursprünglichen URL weitergeleitet werden. Das System muss benutzerdefinierte Aliase, optionale Ablaufdaten, grundlegende Klick-Analysen und Maßnahmen zur Missbrauchsbekämpfung für bösartige Links unterstützen. Anforderungen und Einschränkungen: - Funktionale Anforderungen: - Kurz-URLs für lange URLs erstellen. - Kurz-URLs auf die Original-URLs weiterleiten. - Benutzergesteuerte (custom) Aliase unterstützen, wenn verfügbar. - Optionale Ablaufzeit pro Link unterstützen. - Klickereignisse für Analytics aufzeichnen. - Benutzern erlauben, einen Link manuell zu deaktivieren. - Skalierungsannahmen: - 120 Millionen neue Kurz-URLs pro Monat. - 1,5 Milliarden Weiterleitungen pro Tag. - Weiterleitungsverkehr ist global verteilt und leseintensiv. - Analysedaten sollten innerhalb von 15 Minuten abfragbar sein. - Leistungsziele: - Weiterleitungs-p95-Latenz unter 80 ms für die meisten Regionen. - Erstellung von Short-Links p95 unter 300 ms. - 99.99% Verfügbarkeit für Weiterleitungen. - Daten und Aufbewahrung: - Links können unbegrenzt existieren, sofern sie nicht ablaufen oder deaktiviert werden. - Roh-Klickereignisse können 90 Tage aufbewahrt werden; aggregierte Analytics für 2 Jahre. - Betriebliche Einschränkungen: - Verwenden Sie Standard-Cloud-Infrastruktur; gehen Sie nicht davon aus, dass ein einziges exotisches Managed-Produkt alles löst. - Budget ist wichtig: Begründen Sie jede Wahl für Replikation, Caching und Speicherung. - Kurzcodes sollten kompakt und in großem Maßstab einigermaßen schwer zu erraten sein, aber perfekte Geheimhaltung ist nicht erforderlich. Geben Sie in Ihrer Antwort Folgendes an: 1. Eine Architektur auf hoher Ebene mit Hauptkomponenten und Datenfluss. 2. Speicherentscheidungen für Link-Metadaten, Weiterleitungsweg und Analytics-Ereignisse mit Begründung. 3. Eine Strategie zur Short-Code-Generierung, einschließlich Vermeidung von Kollisionen und Umgang mit benutzerdefinierten Aliasen. 4. Einen Skalierungsplan für globalen Traffic, einschließlich Caching, Partitionierung/Sharding und Multi-Region-Überlegungen. 5. Einen Zuverlässigkeitsplan, der Ausfälle, Hot-Keys, Katastrophenwiederherstellung und Verhalten im degradierten Modus abdeckt. 6. Wichtige APIs und Kerndatenmodelle. 7. Maßnahmen zur Missbrauchsbekämpfung und Sicherheitsüberlegungen. 8. Die wichtigsten Abwägungen, die Sie getroffen haben, und warum.

Bewertungsrichtlinie

Mehr anzeigen ▼

Eine starke Antwort sollte eine kohärente End-to-End-Architektur vorschlagen, die Schreib-, Lese- und Analytics-Anforderungen klar trennt; das Design an die angegebenen Traffic- und Latenzziele anpasst; und Speicher-, Caching-, Replikations- und Partitionierungsentscheidungen in praktischen Begriffen begründet. Sie sollte das global leseintensive Verhalten, kollisionsresistente Codegenerierung, Umgang mit benutzerdefinierten Aliasen, Ablauf und Deaktivierung von Links, eventuale Analytics-Frische und realistische Multi-Region-Zuverlässigkeit adressieren. Gute Antworten besprechen Ausfallmodi wie Cache-Verlust, Regionen-Ausfälle, Datenspeicherprobleme und Hot-Links und erklären, wie eine sanfte Verschlechterung des Dienstes aussieht. Sie sollten sinnvolle APIs und Datenmodelle, Maßnahmen zur Missbrauchsbekämpfung und explizite Abwägungen zu Konsistenz, Kosten, Latenz und operativer Komplexität enthalten. Antworten, die rein generisch bleiben, Einschränkungen ignorieren oder Abwägungsbegründungen weglassen, sollten niedriger bewertet werden.

Antworten

Antwort A: Google Gemini 2.5 Flash

Vollstandige Antwort anzeigen ▼

1. High-level architecture with major components and data flow: * **User/Client:** Interacts with the service. * **API Gateway/Load Balancer:** Entry point for all requests, handles routing, rate limiting, and SSL termination. * **Shorten Service:** Microservice responsible for creating, updating, and managing short URLs. Interacts with Link Metadata DB and Cache. * **Redirect Service:** Microservice optimized for high-throughput, low-latency redirects. Primarily reads from Cache, falls back to Link Metadata DB. Publishes click events to a Message Queue. * **Distributed Cache (e.g., Redis Cluster):** Stores hot short_code to long_url mappings for rapid redirects. * **Link Metadata Database (e.g., Cassandra/DynamoDB):** Stores all short URL metadata (short_code, long_url, expiration, status, etc.). * **Message Queue (e.g., Kafka/Kinesis):** Ingests raw click events from the Redirect Service for asynchronous processing. * **Analytics Processor:** Consumes raw click events from the Message Queue, performs aggregation, and stores them in the Analytics Database. * **Analytics Database (e.g., ClickHouse/Redshift):** Stores aggregated click data for querying. * **Data Lake (e.g., S3):** Stores raw click events for long-term retention and deeper analysis. * **Abuse Detection Service:** Integrates with Shorten Service to scan new URLs for malicious content. * **Monitoring & Alerting:** Observability for all components. **Data Flow:** * **Shorten Request:** User -> API Gateway -> Shorten Service -> Abuse Detection -> Link Metadata DB (write) -> Cache (write). * **Redirect Request:** User -> CDN (optional) -> Load Balancer -> Redirect Service -> Cache (read) -> Link Metadata DB (fallback read) -> Message Queue (write click event) -> Redirect to Long URL. * **Analytics Processing:** Message Queue -> Analytics Processor -> Analytics DB (write aggregated) / Data Lake (write raw). 2. Storage choices for link metadata, redirect path, and analytics events, with rationale: * **Link Metadata (Short URL -> Long URL, Expiration, Status, etc.):** * **Choice:** Globally distributed NoSQL database (e.g., Apache Cassandra or AWS DynamoDB Global Tables). * **Rationale:** Handles high read/write throughput (1.5B reads/day, 120M writes/month), offers low-latency access from multiple regions, provides high availability, and scales horizontally. The primary key would be the `short_code` for efficient lookups. * **Redirect Path (Short Code -> Long URL mapping for fast lookup):** * **Choice:** Distributed in-memory cache (e.g., Redis Cluster). * **Rationale:** Crucial for achieving p95 latency under 80ms for redirects. Reduces load on the primary database significantly. Hot links are aggressively cached with appropriate TTLs (e.g., based on link expiration or LRU policy). Replicated across regions for local access. * **Analytics Events (Raw Clicks):** * **Choice:** Message Queue (e.g., Apache Kafka or AWS Kinesis) for ingestion, followed by a Data Lake (e.g., AWS S3) for storage. * **Rationale:** Kafka/Kinesis handles the immense write volume (1.5B events/day) by decoupling the redirect path from analytics processing, ensuring redirects remain fast. S3 provides cost-effective, highly durable storage for raw events retained for 90 days, suitable for batch processing and historical analysis. * **Aggregated Analytics:** * **Choice:** Columnar analytical database (e.g., ClickHouse or AWS Redshift). * **Rationale:** Optimized for complex analytical queries and aggregations over large datasets. Allows for fast querying of aggregated data (e.g., daily clicks, browser distribution) within 15 minutes, retained for 2 years, without impacting the operational database. 3. Short-code generation strategy, including how to avoid collisions and handle custom aliases: * **Short-code Generation Strategy:** 1. **Distributed ID Generation:** Use a distributed, unique ID generator (e.g., a custom service generating Snowflake-like IDs or UUID v7) to produce a globally unique, monotonically increasing 64-bit integer ID. 2. **Base62 Encoding:** Encode this unique integer ID into a compact Base62 string (0-9, a-z, A-Z). A 64-bit ID can produce a short code of 6-10 characters, offering a vast namespace (e.g., 6 characters provide 62^6 ≈ 56 billion unique codes, sufficient for 120M/month for many years). * **Collision Avoidance:** * **ID-based:** Since the underlying ID is guaranteed unique, the Base62 encoded short code will also be unique, inherently avoiding collisions for system-generated codes. * **Random Fallback (for robustness):** As a secondary option or for specific use cases, a random string generator could be used. In this case, generate a candidate short code, then perform a quick lookup in the Link Metadata DB and Cache. If a collision is detected, regenerate and retry a few times. This is less efficient but provides a fallback. * **Custom Aliases:** 1. **User Submission:** Users submit their desired `custom_alias` along with the `long_url`. 2. **Validation:** The Shorten Service validates the `custom_alias` (e.g., length, allowed characters, not a reserved keyword, not blacklisted). 3. **Uniqueness Check:** Before creation, the Shorten Service performs a lookup in the Link Metadata DB to check if the `custom_alias` already exists. This check must be strongly consistent. 4. **Reservation:** If the `custom_alias` is available, it's stored directly as the `short_code` in the Link Metadata DB. If unavailable, the request is rejected, prompting the user to choose another. 4. Scaling plan for global traffic, including caching, partitioning/sharding, and multi-region considerations: * **Caching:** * **CDN:** Utilize a Content Delivery Network (CDN) for static assets and potentially for DNS resolution of the short links, directing users to the nearest edge location. * **Distributed Cache (Redis Cluster):** Deploy Redis clusters in each major geographic region. These clusters will store the most frequently accessed `short_code` to `long_url` mappings. Cache entries have TTLs aligned with link expiration or an LRU policy. This significantly offloads the database for the 1.5 billion daily redirects. * **Partitioning/Sharding:** * **Link Metadata Database:** Shard the database by the `short_code` (e.g., using a hash of the short code). This distributes data and query load across multiple database nodes. Each shard is replicated for high availability within a region. * **Analytics Database:** Partition raw click events by time (e.g., daily or hourly partitions) and aggregated data by `short_code` and `date` to optimize query performance and data retention policies. * **Multi-Region Considerations:** * **Active-Active for Redirects:** Deploy the Redirect Service, Distributed Cache, and Link Metadata Database (with global replication) in multiple geographic regions (e.g., North America, Europe, Asia-Pacific). Geo-DNS routes users to the closest region, ensuring low-latency redirects globally. * **Active-Passive/Active-Active for Shorten Service:** The Shorten Service can be deployed active-passive (primary in one region, replicas in others) or active-active, depending on the write consistency requirements and complexity. Writes are less frequent than reads, so a slightly higher latency for creation is acceptable if it simplifies consistency. * **Global Database Replication:** The Link Metadata Database (e.g., DynamoDB Global Tables or Cassandra's multi-datacenter replication) ensures data is replicated across regions, allowing local reads for redirects and providing disaster recovery capabilities. * **Analytics Ingestion:** Regional Message Queues (Kafka/Kinesis) aggregate click events locally, which are then streamed to a central Data Lake/Analytics Database or replicated across regions for consolidated analysis. 5. Reliability plan covering failures, hot keys, disaster recovery, and degraded-mode behavior: * **Failures:** * **Redundancy:** All services (Shorten, Redirect, Analytics Processors) are deployed with N+1 redundancy across multiple availability zones within each region, behind load balancers. * **Database Replication:** Link Metadata DB and Analytics DB use synchronous/asynchronous replication across availability zones and regions to ensure data durability and availability. * **Circuit Breakers & Retries:** Implement circuit breakers and exponential backoff/retry mechanisms in microservices to prevent cascading failures and handle transient issues gracefully. * **Monitoring & Alerting:** Comprehensive monitoring of system health, performance metrics, and error rates with automated alerts for critical issues. * **Hot Keys:** * **Cache Sharding:** The Distributed Cache (Redis Cluster) is sharded, distributing hot keys across multiple nodes to prevent a single node from becoming a bottleneck. * **Cache Warming:** For anticipated hot links (e.g., from major campaigns), pre-load them into the cache. * **Rate Limiting:** Implement rate limiting at the API Gateway and Redirect Service levels to protect backend systems from sudden traffic spikes or abuse targeting specific links. * **Disaster Recovery:** * **Multi-Region Active-Active:** The active-active deployment for the Redirect Service and globally replicated Link Metadata DB provides inherent disaster recovery for redirects. If one region fails, traffic is automatically routed to another healthy region via Geo-DNS. * **Data Backups:** Regular, automated backups of all critical databases (Link Metadata, Aggregated Analytics) to geographically separate, durable storage (e.g., S3). * **Recovery Playbooks:** Documented and regularly tested procedures for failover, data restoration, and full system recovery. * **Degraded-Mode Behavior:** * **Analytics Degradation:** If the Message Queue or Analytics Processor experiences issues, raw click events can be temporarily buffered or, in extreme cases, dropped (with alerts). Redirects must continue to function without interruption. * **Cache Misses/Failure:** If the Distributed Cache fails or experiences high latency, the Redirect Service falls back to querying the Link Metadata Database. This will result in higher redirect latency but ensures service continuity. Circuit breakers prevent overwhelming the database. * **Shorten Service Degradation:** If the Shorten Service is impaired, redirects remain unaffected. Users might experience slower link creation or temporary unavailability of the creation API, but existing links will continue to function. 6. Key APIs and core data models: * **Key APIs:** * **`POST /api/v1/shorten`** * **Description:** Creates a new short URL. * **Request Body:** `{"long_url": "string", "custom_alias": "string (optional)", "expiration_date": "ISO 8601 timestamp (optional)", "user_id": "string (optional)"}` * **Response:** `{"short_url": "string", "long_url": "string", "expires_at": "ISO 8601 timestamp (optional)"}` * **`GET /{short_code}`** * **Description:** Redirects to the original long URL. * **Response:** HTTP 301/302 Redirect to `long_url`. * **`GET /api/v1/links/{short_code}/analytics`** * **Description:** Retrieves click analytics for a specific short URL. * **Response:** `{"short_code": "string", "total_clicks": "integer", "daily_clicks": [{"date": "YYYY-MM-DD", "count": "integer"}], "browser_distribution": {"Chrome": 100, "Firefox": 50}, "country_distribution": {"US": 70, "DE": 30}}` * **`PUT /api/v1/links/{short_code}/status`** * **Description:** Updates the status of a short URL (e.g., disable). * **Request Body:** `{"status": "enum (active, disabled)"}` * **Response:** `{"short_code": "string", "status": "string"}` * **Core Data Models:** * **Link Metadata (Stored in Link Metadata DB):** ``` { "short_code": "string (Primary Key)", "long_url": "string", "user_id": "string (Foreign Key, optional)", "created_at": "timestamp", "expires_at": "timestamp (optional)", "status": "enum (active, disabled, expired)", "is_custom_alias": "boolean", "last_accessed_at": "timestamp (for LRU/cleanup)" } ``` * **Click Event (Raw - Stored in Data Lake, ingested via Message Queue):** ``` { "event_id": "UUID (Primary Key)", "short_code": "string", "timestamp": "timestamp", "ip_address_hash": "string (anonymized/hashed)", "user_agent": "string", "referrer": "string (optional)", "country": "string (derived from IP)", "city": "string (derived from IP)" } ``` * **Aggregated Analytics (Stored in Analytics DB):** ``` { "short_code": "string (Partition Key)", "date": "date (Sort Key)", "total_clicks": "integer", "browser_counts": "map<string, integer>", "os_counts": "map<string, integer>", "country_counts": "map<string, integer>", "referrer_counts": "map<string, integer>" } ``` 7. Abuse mitigation and security considerations: * **Malicious Link Detection:** * **Blacklisting:** Maintain a continuously updated blacklist of known malicious domains, phishing sites, and spam URLs. New `long_url` submissions are checked against this list. * **Real-time Scanning:** Integrate with third-party safe browsing APIs (e.g., Google Safe Browsing API, VirusTotal) during the link creation process to scan the `long_url` for known threats. * **Heuristics:** Implement algorithms to detect suspicious URL patterns, excessive redirects, or keywords commonly associated with abuse. * **Spam and Abuse Prevention:** * **Rate Limiting:** Apply strict rate limits on the `POST /shorten` API per IP address and/or authenticated user to prevent automated spamming. * **CAPTCHA/reCAPTCHA:** For anonymous link creation, implement CAPTCHA challenges to deter bots. * **User Accounts:** Require user authentication for custom aliases, higher creation limits, and access to analytics. This provides accountability. * **Reporting Mechanism:** Provide a clear way for users to report abusive short links. Reported links are reviewed and disabled if found malicious. * **Link Disabling:** Allow users to manually disable their own links. The system can also automatically disable links flagged by abuse detection or reported by others. * **Security Considerations:** * **HTTPS Everywhere:** Enforce HTTPS for all API endpoints and redirects to ensure data encryption in transit. * **Input Validation and Sanitization:** Rigorously validate and sanitize all user-provided inputs (`long_url`, `custom_alias`) to prevent common web vulnerabilities like XSS, SQL injection, and path traversal. * **Access Control:** Implement role-based access control (RBAC) for internal management tools and user-specific link management features. * **Data Anonymization:** Anonymize or hash IP addresses and other personally identifiable information (PII) in click analytics data to comply with privacy regulations (e.g., GDPR, CCPA). * **Regular Security Audits:** Conduct periodic security audits, penetration testing, and vulnerability scanning to identify and remediate potential weaknesses. * **DDoS Protection:** Utilize cloud provider DDoS mitigation services (e.g., AWS Shield, Cloudflare) at the edge. 8. The main trade-offs you made and why: * **Consistency vs. Availability/Latency for Redirects:** * **Trade-off:** Prioritized extreme availability and low latency for redirects over strong consistency for link metadata. While link creation requires strong consistency for alias uniqueness, a newly created or updated link might take a few milliseconds to propagate to all caches and database replicas globally before being consistently available for redirects. * **Why:** Redirects are the most critical and high-volume operation. A slight delay in a new link becoming globally redirectable is acceptable, whereas any significant latency or downtime for redirects would severely impact user experience and service reliability targets. * **Cost vs. Performance/Scalability:** * **Trade-off:** Opted for a multi-region, globally replicated architecture with extensive caching and specialized databases, which inherently incurs higher infrastructure costs compared to a single-region, simpler setup. * **Why:** The scale assumptions (1.5B redirects/day, global distribution) and performance targets (p95 < 80ms) necessitate this level of distributed infrastructure. Commodity cloud services and open-source components (like Kafka, Redis) were chosen where possible to optimize cost while meeting performance and scalability requirements. * **Data Granularity vs. Storage Cost/Query Performance for Analytics:** * **Trade-off:** Retain raw click events for a shorter period (90 days) in a cost-effective data lake and store aggregated data for a longer period (2 years) in a more performant, but potentially more expensive, analytics database. * **Why:** Storing 1.5 billion raw events daily for 2 years would be prohibitively expensive and slow for real-time querying. This approach balances the need for detailed historical analysis (via raw data in S3) with the requirement for fast, aggregated insights (via the analytics DB) within budget constraints. * **Short Code Length vs. Collision Probability/Guessability:** * **Trade-off:** Chose Base62 encoding for compact short codes (e.g., 6-10 characters). While a purely random 6-character code has a theoretical collision risk, the ID-based generation strategy eliminates this for system-generated codes. For custom aliases, collision detection is explicit. * **Why:** Compactness is a core feature of a URL shortener. The chosen strategy provides a vast enough namespace to avoid practical collisions for system-generated codes and handles custom alias collisions gracefully, without requiring excessively long or complex short codes that would defeat the purpose of shortening. * **Complexity vs. Feature Set:** * **Trade-off:** Focused on a robust core system for shortening, redirecting, and basic analytics, accepting that more advanced features (e.g., A/B testing, detailed user management, complex reporting) would be iterative additions. * **Why:** To meet the aggressive performance and availability targets for the core functionality within a reasonable design scope. Adding too many features initially would increase complexity, potential failure points, and development time, potentially compromising the core service's stability.

Ergebnis

Siegstimmen

0 / 3

Durchschnittsscore

Bewertungsmodelle OpenAI GPT-5.4

Gesamtpunktzahl

Gesamtkommentar

Antwort A bietet eine kohärente End-to-End-Architektur und deckt alle angeforderten Bereiche ab: Metadatenspeicherung, Cache, Analyse-Pipeline, Codegenerierung, APIs, Missbrauchs-Kontrollen und Kompromisse. Ihre Hauptstärken sind die breite Vollständigkeit und eine sinnvolle Trennung der Pfade für Weiterleitung, Erstellung und Analyse. Sie bleibt jedoch an mehreren Stellen recht allgemein, liefert nur begrenzte quantitative Größenordnungen, ist bei Details zur Multi-Region-Konsistenz etwas vage und geht nicht tief auf knifflige Probleme wie Hot-Key-Minderung, degradierte Modi, Cache-Invalidierung oder explizite Kosten-/Kapazitätsbegründungen ein.

Bewertungsdetails anzeigen ▼

Architekturqualitat

Gewichtung 30%

Solide High-Level-Architektur mit angemessenen Hauptkomponenten und sinnvoller Trennung von Weiterleitung, Erstellung, Cache, Metadaten und Analyse. Das Design ist kohärent, aber einige Entscheidungen bleiben allgemein oder optional, wie die CDN-Nutzung und die Multi-Region-Schreibstrategie, und es fehlt die gleiche Ebene an konkreten operativen Details wie bei einer erstklassigen Antwort.

Vollstandigkeit

Gewichtung 20%

Deckt fast alle angeforderten Themen ab: Architektur, Speicherung, Codegenerierung, Skalierung, Zuverlässigkeit, APIs, Datenmodelle, Missbrauchsbekämpfung und Kompromisse. Kleinere Lücken sind weniger explizites Cache-Invalidierungs-/Update-Verhalten für Deaktivierungs-/Ablaufaktionen und eine weniger detaillierte Behandlung von Analyseabfrage-Dimensionen und Aufbewahrungsmechanismen.

Trade-off-Analyse

Gewichtung 20%

Bietet vernünftige Kompromisse in Bezug auf Konsistenz, Kosten, Analyseaufbewahrung und Code-Länge, aber die Diskussion ist etwas breit und auf hohem Niveau. Sie untersucht nuancierte Produkt-/technische Kompromisse wie die Wahl des Weiterleitungsstatuscodes, Cache-Fähigkeit gegenüber Analyse-Genauigkeit oder Anbieter-/Betriebsalternativen nicht in großer Tiefe.

Skalierbarkeit und Zuverlassigkeit

Gewichtung 20%

Zeigt ein gutes Verständnis für Lese-lastige Skalierung mit Cache plus NoSQL-DB und asynchroner Analyse. Die Abdeckung der Zuverlässigkeit ist anständig, aber einige kritische Aspekte sind unterdefiniert: explizite Konsistenzebenen, realistische Hot-Key-Handhabung über generisches Sharding hinaus, Lastaufnahme bei Cache-Ausfällen und quantifiziertes Multi-Region-Failover-Verhalten.

Klarheit

Gewichtung 10%

Gut organisiert und leicht zu verfolgen, mit nummerierten Abschnitten, die auf die Aufforderung abgestimmt sind. Einige Abschnitte sind wortreich und allgemein, und einige Implementierungsdetails werden eher allgemein als präzise Designentscheidungen beschrieben.

Bewertungsmodelle Google Gemini 2.5 Pro

Gesamtpunktzahl

Gesamtkommentar

Antwort A bietet ein sehr starkes und umfassendes Design, das alle Anforderungen der Aufforderung korrekt erfüllt. Sie schlägt eine Standard- und robuste Architektur mit klarer Trennung der Zuständigkeiten für Schreibvorgänge, Lesevorgänge und Analysen vor. Die Technologieauswahl ist angemessen und die Begründung dafür ist fundiert. Die Antwort ist gut strukturiert und leicht verständlich. Ihre Hauptschwäche ist ein relativer Mangel an Tiefe und Spezifität im Vergleich zu Antwort B, insbesondere bei den Strategien zur Handhabung von Hot Keys und in der Nuancierung der Abwägungsanalyse.

Bewertungsdetails anzeigen ▼

Architekturqualitat

Gewichtung 30%

Die Architektur ist gut durchdacht, mit klarer Trennung der Zuständigkeiten (Shorten, Redirect, Analytics Services) und angemessener Komponentenauswahl. Die Datenflüsse sind logisch und decken alle wichtigen Anwendungsfälle ab. Sie stellt einen soliden, branchenüblichen Ansatz dar.

Vollstandigkeit

Gewichtung 20%

Die Antwort ist sehr vollständig und behandelt alle acht in der Aufforderung geforderten Abschnitte mit ausreichender Detailtiefe. Die APIs und Datenmodelle sind gut definiert und decken die Kernanforderungen ab.

Trade-off-Analyse

Gewichtung 20%

Die Antwort diskutiert mehrere wichtige Abwägungen, wie z. B. Konsistenz vs. Verfügbarkeit und Kosten vs. Leistung. Die Begründung ist logisch und klar mit den getroffenen Designentscheidungen verknüpft.

Skalierbarkeit und Zuverlassigkeit

Gewichtung 20%

Der Plan für Skalierbarkeit und Zuverlässigkeit ist stark und umfasst Multi-Region-Bereitstellung, Caching und Standard-Fehlerwiederherstellungsmechanismen. Die Strategie zur Handhabung von Hot Keys ist jedoch etwas rudimentär; sie erwähnt Sharding und Ratenbegrenzung, lässt aber fortgeschrittenere Techniken vermissen.

Klarheit

Gewichtung 10%

Die Antwort ist sehr klar und gut strukturiert. Die Verwendung von nummerierten Abschnitten und Aufzählungspunkten macht die Informationen leicht verdaulich und nachvollziehbar.

Bewertungsmodelle Anthropic Claude Opus 4.6

Gesamtpunktzahl

Gesamtkommentar

Antwort A bietet ein solides, gut strukturiertes Systemdesign, das alle acht erforderlichen Abschnitte abdeckt. Sie identifiziert korrekt die Hauptkomponenten (API Gateway, Shorten Service, Redirect Service, Redis, Cassandra/DynamoDB, Kafka, ClickHouse, S3) und beschreibt vernünftige Datenflüsse. Die Speicherwahl ist angemessen mit ausreichender Begründung. Die Strategie zur Generierung von Kurzcodes unter Verwendung von Snowflake-IDs mit Base62-Kodierung ist solide. Der Zuverlässigkeitsplan deckt wichtige Fehlerszenarien und degradierte Modi ab. APIs und Datenmodelle sind gut definiert. Die Missbrauchsbekämpfung ist umfassend. Kompromisse werden auf einem angemessenen Niveau diskutiert. Die Antwort bleibt jedoch stellenweise etwas allgemein – es fehlt an spezifischen quantitativen Analysen (z. B. Traffic-Berechnungen, Kapazitätsschätzungen, Kostenschätzungen), die Abwägung zwischen 301 und 302 für Weiterleitungen (entscheidend für Analysen) wird nicht diskutiert, die Abmilderung von Hot Keys über einfaches Cache-Sharding hinaus wird nicht behandelt und es werden keine konkreten Größen für Infrastrukturkomponenten angegeben. Die Multi-Region-Strategie erwähnt Active-Active, aber nicht die Konsistenzebenen oder Replikationsfaktoren. Insgesamt ist es eine kompetente Antwort, der es jedoch an Tiefe und Spezifität mangelt, die sie als außergewöhnlich auszeichnen würden.

Bewertungsdetails anzeigen ▼

Architekturqualitat

Gewichtung 30%

Antwort A präsentiert eine saubere Architektur mit angemessener Komponententrennung (Schreib-, Lese-, Analysepfade). Der Datenfluss ist klar beschrieben. Es mangelt jedoch an Spezifität in Bereichen wie der Strategie für die CDN-Schicht, die Auswirkungen von 301 vs. 302 Weiterleitungen werden nicht diskutiert und die Multi-Region-Strategie ist ohne konkrete Spezifikationen der Konsistenzebene etwas vage.

Vollstandigkeit

Gewichtung 20%

Antwort A deckt alle acht erforderlichen Abschnitte angemessen ab. APIs, Datenmodelle, Missbrauchsbekämpfung und Kompromisse sind alle vorhanden. Es fehlen jedoch quantitative Kapazitätsplanung, Kostenschätzungen, spezifische Infrastrukturgrößen, die 301/302-Abwägung, detaillierte DSGVO-Überlegungen, Schutz vor offenen Weiterleitungen und konkrete Wiederherstellungszeitziele. Die Beschreibung der Analyse-Pipeline ist etwas allgemein.

Trade-off-Analyse

Gewichtung 20%

Antwort A diskutiert fünf Kompromisse, die vernünftig, aber etwas allgemein sind. Der Kompromiss zwischen Konsistenz und Verfügbarkeit ist Standard. Die Diskussion über Kosten vs. Leistung entbehrt spezifischer Zahlen. Die Diskussion über die Länge des Kurzcodes ist angemessen. Die Kompromisse setzen sich nicht tiefgreifend mit den spezifischen Einschränkungen des Problems auseinander (z. B. keine Diskussion über 301 vs. 302, keine Diskussion über spezifische Cassandra vs. relationale DBs, keine Diskussion über den Kompromiss zwischen synchroner und asynchroner Analyse-Pipeline).

Skalierbarkeit und Zuverlassigkeit

Gewichtung 20%

Antwort A deckt Multi-Region-Bereitstellung, Caching, Sharding und Fehlerszenarien auf einem angemessenen Niveau ab. Die Abmilderung von Hot Keys beschränkt sich auf Cache-Sharding und Ratenbegrenzung. Notfallwiederherstellung erwähnt Backups und Multi-Region, es fehlen jedoch spezifische RTO/RPO-Ziele. Das Verhalten im degradierten Modus wird beschrieben, jedoch ohne konkrete Fallback-Strategien. Es werden keine spezifischen Kapazitätszahlen oder Traffic-Berechnungen angegeben.

Klarheit

Gewichtung 10%

Antwort A ist gut organisiert mit klaren Abschnittsüberschriften und konsistenter Formatierung. Die Schreibweise ist klar und leicht verständlich. Datenmodelle verwenden ein lesbares Format. Das Fehlen von Diagrammen und quantitativen Details lässt jedoch einige Abschnitte abstrakt erscheinen. Der Bullet-Point-Stil ist konsistent, führt aber manchmal zu oberflächlichen Beschreibungen.

Antwort B: Anthropic Claude Sonnet 4.6

Vollstandige Antwort anzeigen ▼

DESIGN: GLOBAL URL SHORTENING SERVICE ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 1. HIGH-LEVEL ARCHITECTURE AND DATA FLOW ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ COMPONENTS [Client] │ ▼ [Global Anycast DNS / GeoDNS] │ ▼ [Regional Edge PoPs — CDN / Nginx reverse proxy] │ (cache hit → immediate 301/302 response) │ (cache miss → forward to origin) ▼ [Regional API Gateway (rate-limiting, auth, TLS termination)] │ ├──► [Redirect Service] ──► [Redis Cluster (hot-key cache)] │ │ miss │ ▼ │ [Link Metadata Store (Cassandra)] │ └──► [Creation Service] ──► [ID Generator (Snowflake-style)] │ │ ├──► [Link Metadata Store (Cassandra)] └──► [Custom Alias Checker (Redis SET + Cassandra)] [Redirect Service] ──► [Click Event Publisher (Kafka)] │ ▼ [Stream Processor (Flink / Spark Streaming)] │ ┌───────────┴────────────┐ ▼ ▼ [Raw Event Store [Aggregated Analytics (S3 + Parquet, 90d)] Store (ClickHouse, 2y)] DATA FLOW — REDIRECT (CRITICAL PATH) 1. User visits https://sho.rt/aB3xYz 2. GeoDNS routes to nearest regional PoP. 3. Edge CDN checks its local cache for key "aB3xYz". - HIT: returns HTTP 301 (cacheable) or 302 (non-cacheable for analytics) immediately. Fires async beacon to analytics pipeline. - MISS: forwards to regional Redirect Service. 4. Redirect Service checks regional Redis cluster. - HIT: returns destination URL, fires Kafka event, responds 302. - MISS: reads from Cassandra (nearest replica), populates Redis, responds 302. 5. Kafka consumer (Flink) processes click event within seconds; aggregates land in ClickHouse within ~5 minutes; worst-case 15 minutes. DATA FLOW — CREATION 1. Client POSTs to Creation Service via API Gateway. 2. Rate-limit and auth checks applied. 3. If custom alias: check Redis SET and Cassandra for collision; reject if taken. 4. If auto-generated: Snowflake ID → Base62 encode → 7-character code. 5. Write to Cassandra (quorum write, RF=3). 6. Optionally warm Redis cache immediately. 7. Return short URL to client. ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 2. STORAGE CHOICES ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ LINK METADATA STORE — Apache Cassandra Rationale: - 120M new links/month ≈ 46 links/sec average, with spikes 10–20×. Cassandra handles high write throughput with tunable consistency. - Primary access pattern is single-key lookup by short_code — Cassandra's partition-key model is ideal. - Multi-datacenter replication (RF=3 per region, 3 regions) gives 99.99%+ availability without a single point of failure. - Scales horizontally; no expensive cross-shard transactions needed. - TTL support is native — expired links are automatically tombstoned. - Cost: commodity nodes, no licensing fees. Schema (simplified): Table: links short_code TEXT PRIMARY KEY long_url TEXT owner_id UUID created_at TIMESTAMP expires_at TIMESTAMP (nullable; Cassandra TTL set on row) is_disabled BOOLEAN is_custom BOOLEAN Alternative considered: DynamoDB — good but vendor lock-in and cost at this scale; PostgreSQL — not horizontally scalable for this write volume without significant sharding complexity. REDIRECT PATH CACHE — Redis Cluster (per region) - Stores short_code → {long_url, is_disabled, expires_at} as a hash. - TTL on cache entry = min(link expiry, 24 hours) to avoid stale entries. - Cluster mode with 6 nodes (3 primary + 3 replica) per region; ~50 GB RAM per region covers the hot working set (top ~10M links). - Eviction policy: allkeys-lru. - Cost justified: Redis hit rate expected >95%; each cache miss costs a Cassandra read (~5–10 ms) plus latency; at 17,000 redirects/sec per region, avoiding Cassandra reads is critical for p95 target. ANALYTICS — RAW EVENTS: Apache Kafka + S3 (Parquet) - Kafka (3-broker cluster per region, topic: click_events, 64 partitions) buffers click events durably. - Flink consumers read from Kafka, enrich events (geo-IP, user-agent parsing), and write Parquet files to S3 every 5 minutes. - S3 lifecycle policy deletes raw files after 90 days. - Cost: S3 is cheap (~$0.023/GB/month); 1.5B events/day × ~200 bytes ≈ 300 GB/day → ~27 TB/90 days → ~$620/month storage. ANALYTICS — AGGREGATED: ClickHouse - Flink also writes pre-aggregated rows (per short_code, per hour, per country/device) to ClickHouse. - ClickHouse's columnar storage and vectorized execution make time-series aggregation queries fast. - Replication factor 2 per region; 2-year retention. - Estimated size: ~1 TB/year aggregated → very manageable. - Alternative considered: Apache Druid — also excellent but operationally heavier; ClickHouse is simpler for this use case. ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 3. SHORT-CODE GENERATION STRATEGY ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ AUTO-GENERATED CODES Strategy: Snowflake-style distributed ID → Base62 encoding 1. Each Creation Service instance holds a unique worker ID (assigned at startup via ZooKeeper or a simple DB table). 2. Generate a 64-bit Snowflake ID: [41-bit timestamp ms | 10-bit worker ID | 12-bit sequence]. 3. Base62-encode the ID (characters: 0-9, a-z, A-Z). 4. A 64-bit integer encodes to at most 11 Base62 characters; in practice, for IDs generated in the first ~10 years, 7–8 characters suffice. 5. 7 characters in Base62 = 62^7 ≈ 3.5 trillion combinations — far exceeds 120M/month × 12 months × 10 years = ~14.4 billion links. Collision avoidance: - Snowflake IDs are globally unique by construction (worker ID + timestamp + sequence). No collision is possible unless two workers share the same worker ID, which is prevented by the coordination service. - No need for a "check-then-insert" loop for auto-generated codes. Guessability: - Sequential Snowflake IDs encoded in Base62 are not random but are not trivially enumerable either (timestamp component changes every millisecond, sequence resets). For additional obscurity, XOR the lower 32 bits with a per-deployment secret before encoding. This is not cryptographic security but raises the bar for enumeration attacks. - If stronger unpredictability is needed: generate 6 random bytes → Base62 → 8-character code; check Cassandra for collision (rare at this scale); retry on collision. Expected collision rate at 1.4B existing links out of 62^8 ≈ 218T space is negligible (<0.001%). CUSTOM ALIASES 1. User provides desired alias (e.g., "my-promo-2025"). 2. Validate: 3–50 characters, alphanumeric + hyphens, no reserved words (api, admin, health, etc.). 3. Check Redis SET "custom_aliases" for existence (O(1) bloom-filter-like check, or a Redis SET). 4. Attempt Cassandra INSERT IF NOT EXISTS (lightweight transaction / compare-and-set). 5. If already taken, return HTTP 409 Conflict. 6. Custom aliases are stored with is_custom=true; they are never overwritten by the auto-generation path. ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 4. SCALING PLAN FOR GLOBAL TRAFFIC ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ TRAFFIC MATH - 1.5B redirects/day = ~17,400 req/sec average; assume 3× peak = ~52,000 req/sec. - 120M creations/month = ~46/sec average; 10× peak = ~460/sec. Creation is not the bottleneck. CACHING LAYERS Layer 1 — CDN/Edge (Cloudflare, Fastly, or self-hosted Nginx at PoPs): - Cache 301 responses for non-expiring, non-analytics-critical links. Cache-Control: max-age=3600. - Use 302 for links where per-click analytics are required (most links); these bypass CDN cache but still benefit from geographic proximity. - Estimated CDN hit rate for popular links: 40–60% of traffic served at edge without hitting origin. Layer 2 — Regional Redis Cluster: - Covers the remaining ~40–60% of requests that reach origin. - Expected Redis hit rate: >95% of origin-reaching requests. - Net Cassandra reads: <5% of 17,400 req/sec ≈ ~870 req/sec — well within Cassandra's capacity. PARTITIONING / SHARDING Cassandra: - Partition key = short_code. Cassandra's consistent hashing distributes partitions evenly across nodes. - No manual sharding needed; add nodes to rebalance automatically. - Avoid hotspots: short_code is high-cardinality; no single partition will be disproportionately large. Redis: - Redis Cluster uses hash slots (16,384 slots) distributed across nodes. short_code hashes map evenly. - Hot keys (viral links) handled separately — see Reliability section. Kafka: - 64 partitions per topic; partition key = short_code. Ensures ordered processing per link while parallelizing across consumers. MULTI-REGION DEPLOYMENT Regions: US-East, EU-West, AP-Southeast (minimum 3 for 99.99% availability). Cassandra: - Multi-datacenter replication: RF=3 per datacenter, 3 datacenters. - Writes: LOCAL_QUORUM (2 of 3 nodes in local DC) for creation — fast and consistent within region. - Reads: LOCAL_QUORUM for redirect — reads from nearest DC. - Cross-DC replication is asynchronous; eventual consistency across regions is acceptable for redirects (a newly created link may take <1 second to propagate globally — acceptable). Redis: - Independent cluster per region; no cross-region replication (cost and complexity not justified). - Cache miss falls back to local Cassandra replica. DNS: - GeoDNS routes users to nearest regional API Gateway. - Anycast IP for the redirect domain ensures lowest-latency routing. Creation Service: - Stateless; deploy in each region. Worker IDs are globally unique (coordinated via a lightweight global ZooKeeper or a simple DB table with region prefix). ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 5. RELIABILITY PLAN ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ FAILURE SCENARIOS AND MITIGATIONS Redis node failure: - Redis Cluster promotes replica automatically (typically <30 seconds). - During failover, requests fall through to Cassandra. Cassandra can handle the burst (~870 req/sec normally; burst to ~17,000 req/sec for <30 seconds is manageable with proper provisioning — size Cassandra for 2× expected peak read load). - Circuit breaker in Redirect Service: if Redis is fully unavailable, bypass cache and read directly from Cassandra. Cassandra node failure: - RF=3 with LOCAL_QUORUM means 1 node failure is transparent; 2 node failures degrade to LOCAL_ONE (still functional, slightly less consistent). - Cassandra's gossip protocol detects failures within seconds; hinted handoff ensures writes are not lost. Entire region failure: - GeoDNS health checks detect region unavailability within 30–60 seconds and reroute traffic to next-nearest region. - Cassandra cross-DC replication ensures data is available in surviving regions. - Target: RTO < 2 minutes, RPO = 0 for link metadata (synchronous within-DC quorum writes; async cross-DC replication means <1 second of potential data loss for very recent creations — acceptable). HOT KEYS (VIRAL LINKS) Problem: A single viral short code could generate millions of requests/second, overwhelming a single Redis slot or Cassandra partition. Mitigations: 1. Local in-process cache in each Redirect Service instance (e.g., Caffeine, 10,000-entry LRU, 30-second TTL). Absorbs repeated requests within a single pod without hitting Redis. 2. Redis key replication: for detected hot keys (monitored via Redis MONITOR or a sliding-window counter), replicate the key to multiple Redis slots with a suffix (e.g., aB3xYz:0, aB3xYz:1 ... aB3xYz:N) and randomly select one on read. 3. CDN caching: for non-analytics links, push hot links to CDN with a short TTL (60 seconds) to absorb traffic at the edge. 4. Cassandra: hot keys are not a problem because Redis absorbs >99% of reads for hot links. DISASTER RECOVERY - Cassandra: daily snapshots to S3 (nodetool snapshot). Cross-region replication provides live DR. - Redis: Redis persistence (AOF + RDB) to local disk; Redis is a cache — loss is acceptable (falls back to Cassandra). No cross-region Redis replication needed. - Kafka: replication factor 3 within region; cross-region Kafka MirrorMaker 2 replicates click events to a secondary region for analytics DR. - ClickHouse: replicated tables (ReplicatedMergeTree); daily backups to S3. DEGRADED-MODE BEHAVIOR - If analytics pipeline (Kafka/Flink) is down: redirects continue unaffected. Click events are buffered in Kafka (7-day retention); analytics catch up when pipeline recovers. SLA for analytics (15-minute freshness) may be temporarily violated — acceptable. - If Creation Service is down: existing redirects continue working (read path is independent). New link creation fails gracefully with 503. - If Cassandra is degraded (quorum unavailable): Redirect Service falls back to Redis-only mode. Links not in Redis return 503 rather than an incorrect redirect. This is a last-resort degraded mode. ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 6. KEY APIS AND CORE DATA MODELS ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ REST API POST /api/v1/links Request: { "long_url": "https://example.com/very/long/path?q=1", "custom_alias": "my-promo", // optional "expires_at": "2026-01-01T00:00:00Z", // optional ISO-8601 "owner_id": "uuid" // from auth token } Response 201: { "short_code": "aB3xYz", "short_url": "https://sho.rt/aB3xYz", "long_url": "https://example.com/very/long/path?q=1", "expires_at": "2026-01-01T00:00:00Z", "created_at": "2025-01-15T10:00:00Z" } Errors: 400 (invalid URL), 409 (alias taken), 422 (URL blocked/malicious), 429 (rate limited) GET /{short_code} Response 302: Location: <long_url> Response 301: Location: <long_url> (for cacheable, non-analytics links) Response 404: link not found Response 410: link expired or disabled PATCH /api/v1/links/{short_code} Request: { "is_disabled": true } // or update expires_at Response 200: updated link object Auth: owner only DELETE /api/v1/links/{short_code} Response 204 Auth: owner only GET /api/v1/links/{short_code}/analytics Query params: from, to, granularity (hour/day), group_by (country/device/referrer) Response 200: { "short_code": "aB3xYz", "total_clicks": 142300, "series": [ { "timestamp": "2025-01-15T10:00:00Z", "clicks": 1200, "country": "US" }, ... ] } CORE DATA MODELS links (Cassandra) short_code TEXT PRIMARY KEY long_url TEXT NOT NULL owner_id UUID created_at TIMESTAMP expires_at TIMESTAMP (nullable; also set as Cassandra row TTL) is_disabled BOOLEAN DEFAULT false is_custom BOOLEAN DEFAULT false abuse_flags INT DEFAULT 0 click_events (Kafka → S3 Parquet, raw) event_id UUID short_code TEXT timestamp TIMESTAMP ip_hash TEXT (SHA-256 of IP, for privacy) country_code TEXT (from geo-IP lookup) user_agent TEXT referrer TEXT region TEXT (serving region) analytics_hourly (ClickHouse, aggregated) short_code TEXT hour DateTime country_code TEXT device_type TEXT (mobile/desktop/bot) referrer_domain TEXT click_count UInt64 unique_ips UInt64 (HyperLogLog approximation) PRIMARY KEY (short_code, hour, country_code, device_type) ENGINE = ReplicatedMergeTree users (PostgreSQL — small table, not on hot path) user_id UUID PRIMARY KEY email TEXT UNIQUE api_key_hash TEXT rate_limit_tier TEXT created_at TIMESTAMP ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 7. ABUSE MITIGATION AND SECURITY ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ MALICIOUS URL DETECTION 1. Safe Browsing API check at creation time: submit long_url to Google Safe Browsing (or equivalent) before storing. Reject with 422 if flagged. Latency: ~50–100 ms, acceptable within 300 ms creation SLA. 2. Domain blocklist: maintain a Redis SET of known-bad domains (phishing, malware). Check synchronously at creation. Updated hourly from threat intelligence feeds. 3. Async re-scanning: a background job periodically re-scans stored URLs against updated blocklists. If a previously clean URL is later flagged, set is_disabled=true and abuse_flags=1. Redirect Service checks is_disabled on every request (from cache). 4. URL normalization: parse and normalize URLs at creation to prevent obfuscation (e.g., URL encoding tricks, homograph attacks on domain names — check for IDN homographs). RATE LIMITING - Per-IP rate limit at API Gateway: 10 creations/minute for anonymous, 100/minute for authenticated users, configurable per tier. - Redis-based sliding window counter (token bucket) per IP/user. - Global rate limit: 10,000 creations/second system-wide (well above expected peak of 460/sec). - Redirect path: no rate limit (public); DDoS protection via CDN (Cloudflare DDoS mitigation or equivalent). ENUMERATION PREVENTION - Short codes are not purely sequential (Snowflake XOR obfuscation or random generation). - No API endpoint to list all short codes. - Unauthenticated bulk redirect attempts (>1,000 unique codes/minute from one IP) trigger a CAPTCHA challenge or temporary IP block. AUTHENTICATION AND AUTHORIZATION - API key or OAuth 2.0 JWT for creation and management endpoints. - PATCH/DELETE require ownership verification (owner_id matches token). - Admin API (separate internal endpoint) for abuse team to disable links. PRIVACY - IP addresses are hashed (SHA-256 + per-deployment salt) before storage in analytics. Raw IPs are never persisted. - GDPR: users can request deletion of their links and associated analytics. Cassandra DELETE + S3 lifecycle tag for raw events. HTTPS ENFORCEMENT - All short URLs served over HTTPS only. HTTP requests redirected to HTTPS at the edge. - HSTS header on the short domain. OPEN REDIRECT PREVENTION - Only redirect to URLs that were explicitly registered. No dynamic URL construction from user input at redirect time. - Validate long_url scheme at creation: only http:// and https:// allowed. ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 8. KEY TRADE-OFFS AND JUSTIFICATIONS ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ TRADE-OFF 1: 302 vs 301 for redirects - 301 (permanent) is cached by browsers indefinitely → lowest latency, zero server load for repeat visits. But analytics are lost (browser never calls server again), and disabling/expiring a link is impossible for cached clients. - 302 (temporary) hits the server every time → full analytics, instant disable/expiry. Slightly higher latency for repeat visits. - Decision: Use 302 by default for all links. Offer 301 as an opt-in for users who explicitly want maximum caching and do not need analytics. This is the right default for a service that sells analytics. TRADE-OFF 2: Cassandra vs. relational DB for link metadata - Relational DB (PostgreSQL) would be simpler to operate and supports richer queries. But horizontal scaling for 46 writes/sec average (with 10–20× spikes) and 17,000 reads/sec is painful without significant sharding complexity. - Cassandra sacrifices rich query support (no joins, limited secondary indexes) for linear horizontal scalability and multi-DC replication. Since the only hot query is single-key lookup by short_code, this trade-off is entirely acceptable. TRADE-OFF 3: Eventual consistency for cross-region link propagation - A link created in US-East may not be immediately visible in AP-Southeast (sub-second lag). A user who creates a link and immediately shares it globally could see a brief 404 in distant regions. - Alternative: synchronous cross-region writes (EACH_QUORUM) — guarantees global consistency but adds 100–200 ms latency to creation (violates 300 ms SLA under adverse conditions) and reduces availability. - Decision: Accept eventual consistency. The sub-second propagation window is an acceptable UX trade-off. Document it. Creation SLA is met. TRADE-OFF 4: Snowflake IDs vs. random codes - Snowflake IDs are monotonically increasing → slightly predictable but no collision risk, no DB check needed, operationally simple. - Random codes → better unpredictability, but require a collision check (rare but adds latency and complexity). - Decision: Snowflake + XOR obfuscation for auto-generated codes. Offers a good balance of simplicity, performance, and reasonable unpredictability. Random codes available as an option for security-sensitive use cases. TRADE-OFF 5: Separate analytics pipeline vs. synchronous writes - Writing analytics synchronously to a DB on every redirect would add latency to the critical path and create a write bottleneck at 17,000 req/sec. - Async Kafka pipeline decouples analytics from the redirect path entirely. The cost is eventual consistency in analytics (up to 15 minutes) and added operational complexity (Kafka + Flink + ClickHouse). - Decision: Async pipeline. The 15-minute analytics freshness requirement explicitly allows this. The redirect path must be fast; analytics can lag. TRADE-OFF 6: ClickHouse vs. Druid vs. BigQuery for analytics - BigQuery: fully managed, no ops, but high query latency (seconds) and cost at this event volume. - Druid: excellent for real-time analytics but operationally complex (ZooKeeper, Broker, Historical, MiddleManager nodes). - ClickHouse: simpler to operate than Druid, excellent query performance, cost-effective on commodity hardware, good Kafka integration. - Decision: ClickHouse. Best balance of operational simplicity, performance, and cost for this use case. ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ CAPACITY SUMMARY (3-REGION DEPLOYMENT) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ Redirect Service: ~30 pods × 3 regions (auto-scaled, stateless) Creation Service: ~5 pods × 3 regions Cassandra: 9 nodes × 3 regions (RF=3 per DC), ~2 TB SSD each Redis Cluster: 6 nodes × 3 regions, 50 GB RAM each Kafka: 3 brokers × 3 regions Flink: 10 task managers × 3 regions ClickHouse: 4 nodes × 3 regions (replicated) S3: ~27 TB raw events/90 days + ~3 TB aggregated/2 years Estimated monthly infrastructure cost: $15,000–$25,000 (commodity cloud VMs), dominated by Cassandra storage and Redis memory. CDN egress is the largest variable cost at scale.

Ergebnis

#1 | Sieger

Siegstimmen

3 / 3

Durchschnittsscore

Bewertungsmodelle OpenAI GPT-5.4

Gesamtpunktzahl

Gesamtkommentar

Antwort B präsentiert ein stärkeres, produktionsorientierteres Design mit klarer Komponententrennung, konkretem Datenfluss, Begründung der Speicherung, Konsistenzentscheidungen, Kapazitätsberechnungen und detaillierter Zuverlässigkeitsbehandlung. Sie adressiert direkt die Skalierungs- und Latenzziele mit geschichteter Zwischenspeicherung, regionaler Bereitstellung, expliziten Cassandra-Konsistenzebenen, Kafka/Flink/ClickHouse-Analysen und detaillierterer Analyse von Fehlermodi. Sie enthält auch praktische API-Definitionen, Datenmodelle, Missbrauchsschutz und explizite Abwägungen bezüglich 301 vs. 302, eventual consistency und Kosten/betrieblicher Komplexität.

Bewertungsdetails anzeigen ▼

Architekturqualitat

Gewichtung 30%

Sehr starke Architektur mit klarer Trennung von Lesen/Schreiben/Analyse, expliziter regionaler Edge-Schicht, Cache-Hierarchie, Metadatenspeicher, Streaming-Pipeline und konkreten Anfrageflüssen. Das Design verknüpft die Komponentenauswahl direkt mit den Anforderungen an Latenz und Aktualität und spiegelt ein produktionsreiferes End-to-End-System wider.

Vollstandigkeit

Gewichtung 20%

Deckt alle angeforderten Bereiche gründlich ab, einschließlich Architektur, Speicherung, Codegenerierung, Skalierung, Zuverlässigkeit, APIs, Modelle, Missbrauchsbekämpfung und Abwägungen. Es enthält auch nützliche Details wie Traffic-Berechnungen, Retention-Dimensionierung, Konsistenzebenen und degradierte Modi, die die Vollständigkeit stärken.

Trade-off-Analyse

Gewichtung 20%

Exzellente Abwägungsdiskussion mit konkreten Entscheidungen und Alternativen: 301 vs. 302, Cassandra vs. relationale DB, eventual consistency vs. synchrone globale Schreibvorgänge, Snowflake vs. zufällige Codes, asynchrone Analyse vs. synchrone Schreibvorgänge, CDN-Cache-Umfang und Auswahl des Analyse-Speichers. Die Begründung ist explizit und gut an die angegebenen Anforderungen gebunden.

Skalierbarkeit und Zuverlassigkeit

Gewichtung 20%

Starke Skalierungs- und Zuverlässigkeitsplanung mit Traffic-Berechnungen, geschichteten Caches, Partitionierungsstrategie, regionaler Bereitstellung, Cassandra-Replikations-/Konsistenzentscheidungen, Kafka-Partitionierung, Hot-Key-Minderung, Failover-Szenarien, DR-Maßnahmen und degradierten Modi. Die Antwort ist bemerkenswert stärker in Bezug auf betriebliche Realität und Fehleranalyse.

Klarheit

Gewichtung 10%

Sehr klar und strukturiert, mit starken Überschriften, getrennten Datenflüssen, Begründung der Speicherung, Fehlerszenarien und Abwägungen. Es ist dicht, aber die Organisation erleichtert die Bewertung des Designs und die Nachverfolgung der Entscheidungen.

Bewertungsmodelle Google Gemini 2.5 Pro

Gesamtpunktzahl

Gesamtkommentar

Antwort B ist ein außergewöhnliches Systemdesign auf Prinzipalebene. Es deckt nicht nur alle Anforderungen ab, sondern tut dies mit herausragender Tiefe, Spezifität und Klarheit. Das Design basiert auf quantitativen Analysen (z. B. „Traffic Math“), und die Technologieauswahl wird durch detaillierte Vergleiche mit Alternativen begründet. Sein Zuverlässigkeitsplan, insbesondere die mehrschichtige Strategie zur Handhabung von Hot Keys, ist besonders fortschrittlich. Die Abwägung von Kompromissen ist nuanciert und deckt kritische, praktische Dilemmata ab. Die Formatierung und die Einbeziehung zusätzlicher Details wie eine Kapazitätsübersicht und Kostenschätzung machen es zu einer wirklich erstklassigen Antwort.

Bewertungsdetails anzeigen ▼

Architekturqualitat

Gewichtung 30%

Die Architektur ist herausragend. Sie präsentiert ein hochdetailliertes, mehrschichtiges System (CDN, regionale PoPs, Dienste) und spezifiziert konkrete Technologien mit starken Begründungen. Die textbasierten Flussdiagramme sind äußerst effektiv zur Vermittlung des Designs, insbesondere des kritischen Weiterleitungspfads.

Vollstandigkeit

Gewichtung 20%

100

Die Antwort ist außergewöhnlich vollständig. Sie behandelt alle Anforderungen der Aufgabenstellung im Detail und geht darüber hinaus, indem sie Verkehrsberechnungen, eine detaillierte Kapazitätsübersicht und eine geschätzte Infrastrukturkosten enthält, was dem Design einen erheblichen praktischen Wert verleiht.

Trade-off-Analyse

Gewichtung 20%

Die Abwägung von Kompromissen ist beispielhaft. Sie identifiziert sieben verschiedene, hochrelevante Kompromisse und diskutiert sie mit tiefem Einblick, wie z. B. die praktischen Auswirkungen von 301- vs. 302-Weiterleitungen für die Analyse, und vergleicht spezifische Technologiealternativen (z. B. ClickHouse vs. Druid vs. BigQuery).

Skalierbarkeit und Zuverlassigkeit

Gewichtung 20%

Dies ist ein herausragender Abschnitt. Der Skalierabilitätsplan basiert auf Traffic Math, und der Zuverlässigkeitsplan ist äußerst robust. Die mehrschichtige Strategie zur Minderung von Hot Keys (In-Prozess-Cache, Redis-Schlüsselreplikation, CDN) ist besonders ausgefeilt und zeigt ein tiefes Verständnis für reale Ausfallmodi im großen Maßstab.

Klarheit

Gewichtung 10%

100

Die Klarheit ist perfekt. Die Verwendung von strukturierten Formaten, Überschriften und textbasierten Flussdiagrammen macht ein hochkomplexes Design außergewöhnlich leicht verständlich. Der logische Fluss von der High-Level-Architektur zu den Low-Level-Datenmodellen ist fehlerfrei.

Bewertungsmodelle Anthropic Claude Opus 4.6

Gesamtpunktzahl

Gesamtkommentar

Antwort B liefert ein außergewöhnlich detailliertes und gut strukturiertes Systemdesign, das weit über das Basisniveau hinausgeht. Es enthält ASCII-Architekturdiagramme, konkrete Verkehrsmathematik (17.400 Anfragen/Sek., Spitzenberechnungen), spezifische Infrastrukturgrößen (Knotenanzahl, RAM, Speicher) und geschätzte monatliche Kosten (15.000-25.000 USD). Der Speicherbereich bietet detaillierte Begründungen, einschließlich Kostenberechnungen (z. B. 620 USD/Monat für S3-Rohereignisse). Die Strategie zur Generierung von Kurz-URLs beinhaltet eine durchdachte XOR-Verschleierungstechnik zur Verhinderung von Enumeration. Der Skalierungsplan liefert spezifische Zahlen für CDN-Trefferquoten, Redis-Trefferquoten und die daraus resultierende Cassandra-Last. Der Zuverlässigkeitsplan befasst sich mit spezifischen Ausfallszenarien mit konkreten Wiederherstellungszeiten (RTO < 2 Minuten) und beinhaltet hochentwickelte Hot-Key-Minderungsmaßnahmen (lokaler In-Prozess-Cache, Redis-Schlüsselreplikation mit Suffixen). Die Diskussion über den 301- vs. 302-Kompromiss ist besonders aufschlussreich und direkt relevant für die Analyseanforderung. Das API-Design beinhaltet ordnungsgemäße HTTP-Statuscodes für Randfälle (410 für abgelaufene/deaktivierte Links, 422 für bösartige URLs). Sieben verschiedene Kompromisse werden mit klaren Begründungen diskutiert. Die Kapazitätszusammenfassung liefert einen konkreten Bereitstellungsplan. Kleinere Schwächen sind die sehr lange Antwort und einige Bereiche, in denen die betriebliche Komplexität stärker diskutiert werden könnte (z. B. Verwaltung von ZooKeeper für Snowflake-Worker-IDs über Regionen hinweg).

Bewertungsdetails anzeigen ▼

Architekturqualitat

Gewichtung 30%

Antwort B bietet eine detailliertere und kohärentere Architektur mit ASCII-Diagrammen, einer expliziten CDN/Edge-Schicht mit der kritischen Unterscheidung zwischen 301 und 302, spezifischen Konsistenzebenen (LOCAL_QUORUM) und einer klaren Trennung der Zuständigkeiten. Die Datenflussbeschreibungen umfassen spezifische Cache-Treffer-/Fehlerpfade und die Analyse-Pipeline ist gut integriert. Die Architektur adressiert direkt die angegebenen Verkehrs- und Latenzziele mit quantitativer Untermauerung.

Vollstandigkeit

Gewichtung 20%

Antwort B deckt alle acht Abschnitte mit deutlich mehr Tiefe ab. Sie enthält Verkehrsmathematik, Kapazitätszusammenfassung mit spezifischen Knotenzahlen und RAM, Kostenschätzungen (15.000-25.000 USD/Monat), S3-Speicherkostenberechnungen, RTO/RPO-Ziele, GDPR-Löschverfahren, Schutz vor offenen Weiterleitungen, URL-Normalisierung, HSTS-Header, Verhinderung von Enumeration und eine Benutzertabelle für die Authentifizierung. Der Kompromiss zwischen 301 und 302 sowie der Umfang des CDN-Cachings werden als separate Überlegungen behandelt. Ein Abschnitt zur Kapazitätszusammenfassung bietet zusätzliche Vollständigkeit.

Trade-off-Analyse

Gewichtung 20%

Antwort B diskutiert sieben gut formulierte Kompromisse mit spezifischen Begründungen, die an die Problembeschränkungen gebunden sind. Der Kompromiss zwischen 301 und 302 ist besonders aufschlussreich und direkt relevant für die Analyseanforderung. Der Kompromiss zwischen Cassandra und relationaler DB beinhaltet spezifische Durchsatzzahlen. Der Kompromiss der eventualen Konsistenz erwähnt die spezifischen SLA-Auswirkungen. Der Vergleich ClickHouse vs. Druid vs. BigQuery liefert konkrete betriebliche Begründungen. Jeder Kompromiss gibt klar die Entscheidung und den Grund dafür an, wo angebracht mit quantitativer Untermauerung.

Skalierbarkeit und Zuverlassigkeit

Gewichtung 20%

Antwort B liefert detaillierte Verkehrsmathematik (17.400 Anfragen/Sek. im Durchschnitt, 52.000 Spitzenwerte), spezifische Cache-Trefferquotenschätzungen (CDN 40-60%, Redis >95%), daraus resultierende Cassandra-Lastberechnungen (~870 Anfragen/Sek.) und konkrete Infrastrukturgrößen. Die Minderung von Hot Keys umfasst drei hochentwickelte Strategien (lokaler In-Prozess-Cache, Redis-Schlüsselreplikation mit Suffixen, CDN-Push). Ausfallszenarien beinhalten spezifische Wiederherstellungszeiten (RTO < 2 Minuten, RPO < 1 Sekunde). Das Verhalten bei Redis-Failover wird mit Zeitangaben beschrieben (<30 Sekunden). Der Degradationspfad von Cassandra ist klar spezifiziert.

Klarheit

Gewichtung 10%

Antwort B verwendet ASCII-Art-Diagramme, klare Abschnittstrenner und ein strukturiertes Format, das die Navigation erleichtert. Die Einbeziehung spezifischer Zahlen, Berechnungen und konkreter Beispiele verbessert die Klarheit. Die Kompromissabschnitte sind besonders gut strukturiert mit klaren Entscheidungsformulierungen. Die Kapazitätszusammenfassung bietet eine schnelle Referenz. Die Antwort ist länger, aber die zusätzliche Länge wird durch substanzielle Inhalte und nicht durch Weitschweifigkeit gerechtfertigt.

Vergleichsuebersicht

Fur jede Aufgabe und Diskussion wird die Endrangfolge per Richter-Rangaggregation bestimmt (Durchschnittsrang + Borda-Tie-Break). Der Durchschnittsscore wird als Referenz angezeigt.

Bewerter: 3

Google Gemini 2.5 Flash

Siegstimmen

0 / 3

Durchschnittsscore

Diese Antwort ansehen

Sieger Anthropic Claude Sonnet 4.6

Siegstimmen

3 / 3

Durchschnittsscore

Diese Antwort ansehen

Gesamtbilanz dieser Modellpaarung ansehen

Bewertungsergebnisse

Bewertungsmodelle Anthropic Claude Opus 4.6

Gemini 2.5 Flash 62

Claude Sonnet 4.6 Sieger 85

Warum diese Seite gewann

Antwort B gewinnt eindeutig nach allen Kriterien. Sie bietet deutlich mehr Tiefe und Spezifität als Antwort A, einschließlich konkreter Verkehrsberechnungen, Dimensionierung der Infrastruktur, Kostenschätzungen und nuancierter Abwägungsdiskussionen (insbesondere der 301 vs. 302 Redirect-Abwägung, die für die Analyse entscheidend ist). Der Zuverlässigkeitsplan von Antwort B ist detaillierter mit spezifischen Ausfallszenarien und Wiederherstellungsmetriken. Der Skalierungsplan enthält eine quantitative Analyse der Cache-Trefferraten und der daraus resultierenden Datenbanklast. Die Strategie zur Minderung von Hot-Keys (lokaler In-Process-Cache, Redis-Schlüsselreplikation mit Suffixen) ist ausgefeilter. Der Abschnitt zur Missbrauchsbekämpfung enthält zusätzliche Überlegungen wie URL-Normalisierung, Verhinderung von offenen Redirects und asynchrone Neuprüfung. Die Kapazitätsübersicht liefert einen konkreten Bereitstellungsplan, der Antwort A vollständig fehlt. Während Antwort A kompetent ist, zeigt Antwort B die Art von Tiefe und praktischem Ingenieurwissen, die in einem erstklassigen Systemdesign erwartet wird.

Bewertungsmodelle Google Gemini 2.5 Pro

Gemini 2.5 Flash 85

Claude Sonnet 4.6 Sieger 98

Warum diese Seite gewann

Antwort B gewinnt überzeugend aufgrund ihrer überlegenen Tiefe, Spezifität und quantitativen Begründung über alle Kriterien hinweg. Während Antwort A ein sehr gutes Design liefert, ist die Analyse von Antwort B auf einem höheren Niveau technischer Reife. Dies zeigt sich am deutlichsten in ihrem detaillierten Skalierabilitätsplan, der auf Verkehrsberechnungen basiert, ihrer fortschrittlichen mehrschichtigen Strategie zur Handhabung von Hot Keys und ihrer nuancierteren und umfassenderen Diskussion von Kompromissen. Die außergewöhnliche Klarheit und Vollständigkeit, einschließlich Bonusteilen zu Kapazität und Kosten, festigen ihre Position als die bessere Antwort weiter.

Bewertungsmodelle OpenAI GPT-5.4

Gemini 2.5 Flash 75

Claude Sonnet 4.6 Sieger 90

Warum diese Seite gewann

Antwort B gewinnt, da sie bei den am stärksten gewichteten Kriterien am besten abschneidet: Architekturqualität, Abwägung von Kompromissen und Skalierbarkeit/Zuverlässigkeit. Beide Antworten sind vollständig und im Großen und Ganzen korrekt, aber B ist konkreter und realistischer in Bezug auf globalen Traffic, Cache-Layering, Konsistenzsemantik, Hot Keys, regionales Failover, Aktualität von Analysen und Kosten-/Kapazitätsimplikationen. Diese zusätzliche Strenge macht sie insgesamt zur stärkeren Antwort im Systemdesign.

Entwerfen Sie einen globalen URL-Verkürzungsdienst

Aufgabenubersicht

Aufgabenstellung

Antworten

Antwort A: Google Gemini 2.5 Flash

Antwort B: Anthropic Claude Sonnet 4.6

Vergleichsuebersicht

Bewertungsergebnisse

Verwandte Aufgaben

Wählen Sie die vielversprechendste Reform für das Schulmittagessen

Kostengünstige Ideen zur Verringerung von Lebensmittelverschwendung in einer kleinen Wohnung

Kundensupport-Antwort als ruhige Reiseberaterin

Wählen Sie die beste Strategie, um den Stadtverkehr schnell zu reduzieren

Wochenendplan zur Wiederherstellung des Gemeinschaftsgartens

Kostengünstige Ideen zur Verringerung von Lebensmittelabfällen in Haushalten generieren

Schreibe einen Monolog für einen Museums-Audioguide aus der Perspektive eines ungewöhnlichen Artefakts

Schreibe einen sauberen, originellen Stand-up-Monolog über alltägliche Technologie

Verwandte Links