URL短縮サービスの設計

このシステム設計ベンチマークに対する各AIの回答と比較結果を確認できます。

いいね・お気に入り機能を使うにはログインまたは新規登録が必要です。新規登録

X f L

お題概要

比較ジャンル

システム設計

お題作成モデルお題作成者は、対応プロバイダ各社の上位お題生成モデル候補の中からランダムに選ばれます。

Anthropic Claude Opus 4.6

回答モデルこのお題では、お題作成者と同じプロバイダのモデルは回答対象から除外されます。

回答A OpenAI GPT-5.2

回答B Google Gemini 2.5 Pro

採点モデル採点は回答モデルを除いた候補から3モデルで実施します。3モデルは異なる3プロバイダから選び、上位モデルを最低1つ含め、軽量モデルは採点者に選びません。

OpenAI GPT-5.4 Anthropic Claude Opus 4.6 Google Gemini 2.5 Flash

お題本文

さらに表示 ▼

bit.lyやTinyURLのようなURL短縮サービスを設計してください。設計は以下の側面を考慮する必要があります。 1. **機能要件**: サービスがサポートする必要があるコア機能は何ですか？URLの作成、リダイレクト、有効期限、分析を考慮してください。 2. **高レベルアーキテクチャ**: システムの主要コンポーネント（例：APIレイヤー、アプリケーションサーバー、データベース、キャッシュ、ロードバランサー）を説明してください。それらがどのように相互作用するかを説明してください。 3. **URLエンコーディング戦略**: 各URLに短くユニークなキーをどのように生成しますか？アプローチ（例：ハッシュ化、base62エンコーディング、事前生成キーサービス）について議論し、衝突をどのように処理するかを説明してください。 4. **データベース設計**: どのようなデータベースを使用し、その理由は何ですか？コアテーブルのスキーマを提供してください。このユースケースにおけるSQLとNoSQLのトレードオフについて議論してください。 5. **スケーラビリティとパフォーマンス**: 高い読み取りトラフィック（例：1日あたり数百万のリダイレクト）をどのように処理しますか？キャッシュ戦略、データベースパーティショニングまたはシャーディング、リードレプリカについて議論してください。 6. **信頼性と可用性**: コンポーネントが失敗した場合、サービスが利用可能であることをどのように保証しますか？冗長性、レプリケーション、フェイルオーバー戦略について議論してください。 7. **レート制限と不正利用防止**: サービスが悪用されるのをどのように防ぎますか？実装の出発点としてシニアエンジニアが使用できる、明確で構造化された計画を提供してください。月間1億件の新規URLと100:1の読み取り/書き込み比率を想定した概算容量見積もりを含めてください。

採点方針

優れた回答は、次の基準で評価されるべきです。(1) 完全性 — プロンプトに記載されている7つの側面すべてが、単に言及されるだけでなく、意味のある詳細で対処されていること。(2) 技術的な深さ — 回答は、SQL vs NoSQL、ハッシュ化 vs カウンターベースのID生成、キャッシュエビクションポリシー、一貫性モデルなどの現実世界のトレードオフを理解していることを示すべきです。(3) 容量見積もり — 回答には、指定されたトラフィック数に基づいたストレージ、帯域幅、QPSの概算計算が含まれるべきです。(4) 明確さと構造 — 計画は論理的に整理され、フォローしやすいものであるべきです。(5) 実用性 — 提案された設計は、過度に理論的ではなく、現実的で実装可能であるべきです。トレードオフを正当化したり議論したりすることなく、曖昧または表面的な説明しか提供しない回答は、低く評価されるべきです。テキストで説明された図、具体的なスキーマ定義、および根拠のある特定のテクノロジー推奨事項を含む回答は、高く評価されるべきです。

回答

回答A: OpenAI GPT-5.2

機能要件
コア (MVP)

短縮URLの作成
- 入力: long_url、オプションで custom_alias、オプションで expiration、オプションで user_id/api_key
- 出力: short_url、key、created_at、expiry_at
リダイレクト
- GET /{key} -> long_url へ 301/302
- 有効期限/無効状態を尊重する
基本的な分析
- キーごとのリダイレクト数をカウント (合計 + 時間バケット)
- オプション: リファラー、国/地域 (概算)、ユーザーエージェントファミリー、デバイスタイプ
リンク管理
- メタデータの取得 (long_url、created_at、expiry_at、status)
- 無効化/削除 (ソフト削除)
  あると嬉しい機能
顧客ごとのカスタムドメイン
一括短縮API
QRコード生成...

全文を表示 ▼

機能要件
コア (MVP)

短縮URLの作成
- 入力: long_url、オプションで custom_alias、オプションで expiration、オプションで user_id/api_key
- 出力: short_url、key、created_at、expiry_at
リダイレクト
- GET /{key} -> long_url へ 301/302
- 有効期限/無効状態を尊重する
基本的な分析
- キーごとのリダイレクト数をカウント (合計 + 時間バケット)
- オプション: リファラー、国/地域 (概算)、ユーザーエージェントファミリー、デバイスタイプ
リンク管理
- メタデータの取得 (long_url、created_at、expiry_at、status)
- 無効化/削除 (ソフト削除)
  あると嬉しい機能
顧客ごとのカスタムドメイン
一括短縮API
QRコード生成
マルウェア対策/セーフブラウジングチェック
A/Bルーティング、UTMテンプレート
非機能要件
非常に低いリダイレクトレイテンシ (p95 < ~20–50ms、エッジ/キャッシュより)
高可用性 (マルチAZ/リージョン)
分析には強い一貫性は不要だが、キー->URLマッピングには必要

高レベルアーキテクチャ
トラフィックフロー

DNS -> CDN/エッジ (オプションだが推奨)
グローバルロードバランサー (GSLB) -> リージョンL7ロードバランサー
APIゲートウェイ
- 認証 (APIキー/OAuth)、スロットリング、リクエスト検証
アプリケーションサービス (ステートレス)
- 短縮サービス (書き込み)
- リダイレクトサービス (読み取り、非常にホットなパス)
- 分析取り込みサービス (非同期)
  データレイヤー
キー->宛先レコードのマッピングのためのプライマリキーバリューストア
ホットキー検索のためのキャッシュレイヤー (Redis/Memcached)
分析パイプライン
- リダイレクトサービスがログ/キュー (Kafka/PubSub/Kinesis) にイベントを発行
- ストリームプロセッサがOLAPストア (ClickHouse/BigQuery/Druid) および/または時系列データベース (Cassandra/Scylla) に集計
- ダッシュボードのための定期的なロールアップ
  サポートサービス
キー生成サービス (事前に生成されたIDを使用する場合)
悪用検出サービス (URL評判、ユーザー行動)
可観測性: メトリクス、トレース、ログ

インタラクション

作成:
- クライアント -> APIゲートウェイ -> 短縮サービス
- URLの検証、悪用のチェック、オプションのカスタムエイリアスのユニーク性チェック
- 一意のキーの取得 (後述のエンコーディング戦略)
- DBへのマッピングの書き込み
- キャッシュの無効化/プライミング
リダイレクト:
- クライアント -> CDN/エッジ -> リダイレクトサービス
- キャッシュでのキー検索。ミスの場合、DBに問い合わせる
- 見つかり、期限切れ/無効でなければ: 301/302を応答
- 非同期分析イベントの発行

URLエンコーディング戦略
目標: ユニーク性、短い長さ、高スループット、中央のボトルネックなし。
推奨: 数値ID + Base62

単調増加する64ビットID (または時間順ID) を使用し、Base62 (0-9a-zA-Z) でエンコードする。
月1億件の新規URL (~平均3.86k書き込み/秒、ピークはもっと高い) の場合、ID生成は毎秒数万件以上をサポートする必要がある。
オプション:
A) データベースシーケンス (シンプル)
長所: 簡単、確実にユニーク
短所: ボトルネックになり、シャード間での調整が困難
B) 分散ID (Snowflakeライク) (推奨)
64ビット: タイムスタンプ + リージョン/ノード + シーケンス
長所: スケーラブル、単一ライターなし
短所: フル64ビットをエンコードするとキーがわずかに長くなる (Base62では最大11文字だがコンパクト)
C) 事前生成キープール
バックグラウンドジョブでランダムなBase62文字列を生成し、未使用プールを保存。アプリがキーを予約。
長所: 順序付けからの分離、キーを短く保つことができる
短所: プール管理の複雑さ
衝突処理
IDベースのアプローチの場合: 構成上、衝突なし。
カスタムエイリアスまたはランダムキーの場合: 条件付きPUT/ユニーク制約でユニーク性を強制。衝突した場合は、新しいキーで再試行。
キーの長さ
必要なBase62の長さ: 月1億件は年間約12億件を意味する。Base62^7 ≈ 3.5兆なので、シーケンシャルIDを使用する場合は7文字で十分。Snowflake IDは10〜11文字になる可能性があるが、許容範囲内。

データベース設計
プライマリストアの要件

非常に高い読み取りQPS、キーベースのルックアップ、小さなレコード、低レイテンシ。
キーのユニーク性のための強く一貫した書き込み。キャッシュが正しければ読み取りは最終的に一貫してもよいが、新しいリンクでは書き込み後の読み取りの一貫性を優先する。
推奨: DynamoDB / Cassandra / ScyllaDB (NoSQL KV) または MySQL/Postgres (シャーディング付き)。
NoSQL KVの長所: 水平スケーリング、高スループット、予測可能なレイテンシ。
SQLの長所: 制約、トランザクション、カスタムエイリアスのユニーク性や管理クエリが簡単。ただし、スケールするとシャーディング/レプリカがより複雑になる。
実用的な選択肢
マッピングストア: DynamoDB (またはCassandra/Scylla) をシステムオブレコードとして使用。
オプションで、ユーザー/アカウント/請求のためのリレーショナルストア。
コアスキーマ (KV / ワイドカラム)
テーブル: url_mapping
key (パーティションキー、文字列)
long_url (文字列)
created_at (タイムスタンプ)
expiry_at (タイムスタンプ、NULL許容)
status (active|disabled|deleted)
user_id (文字列/uuid、NULL許容)
custom_alias (ブール値)
domain (文字列、デフォルト)
last_accessed_at (タイムスタンプ、NULL許容)
redirect_code (整数: 301/302)
インデックス/アクセスパターン
プライマリ: key -> record
ユーザー別 (管理UI用): セカンダリインデックス
- GSI: user_id をパーティションキー、created_at をソートキー (または逆順)
long_url別 (オプションの重複排除): hash(long_url) インデックス (「同じlong URLが同じキーを返す」動作をしたい場合のみ)
分析ストレージ (別)
オブジェクトストレージ (S3/GCS) に生イベントを保存 + OLAPへのストリーミング集計。
集計テーブル例 (ClickHouse): (key, day/hour, redirects, unique_ips_approx, country, referrer_domain, ua_family)
SQL vs NoSQL のトレードオフ概要
SQL: カスタムエイリアスのユニーク性、アドホッククエリが容易。注意深いシャーディングなしでの書き込み/読み取りのスケーリングが困難。
NoSQL: プライマリルックアップワークロードに最適。アクセスパターンを事前に設計する必要がある。カスタムエイリアスのユニーク性は、条件付き書き込みで処理。

スケーラビリティとパフォーマンス
トラフィック推定

書き込み: 月1億件 ≈ 平均3.86k/秒、ピーク時10倍を計画 => ~40k/秒。
読み取り: 100:1 => 平均386k/秒のリダイレクト、ピーク時10倍を計画 => 世界全体で ~4M/秒。
ストレージ
月1億件 * 12 = 年間12億件のマッピング。
レコードサイズ (キー ~10B、URL平均200B、メタデータ): ~500B–1KB と仮定。
1.2B * 1KB ≈ 年間1.2TB (レプリケーションとインデックスのオーバーヘッドを除く)。
キャッシュ
各リージョンにRedis/Memcachedクラスタ。
キャッシュキー: 短いキー。値: long_url + status + expiry_at + redirect_code。
TTL戦略:
- 有効期限のないリンクの場合: 長いTTL (例: 1〜7日)、アクセス時にリフレッシュ。
- 有効期限のあるリンクの場合: 有効期限に合わせたTTL。
存在しない/無効なキーのネガティブキャッシュ (短いTTL) でDBヒットを削減。
CDN/エッジキャッシュ (安全な場合):
- 公開され、有効期限のないリンクの301をキャッシュ。ユーザーごとまたは動的なリダイレクトには注意が必要。
  シャーディング/パーティショニング
NoSQL: キーでパーティション化。均一な分散を保証。
SQLの場合: キーハッシュでシャード化。ルーティングレイヤーを維持。
読み取りレプリカ
SQLまたはレプリケートされたKVストアを使用する場合: 管理/読み取り負荷の高い非リダイレクトクエリのために読み取りレプリカを追加。
ホットキー
非常に人気のある短縮URLはキャッシュノードを過負荷にする可能性がある。
- 十分な仮想ノードを持つ一貫性ハッシュを使用。
- リダイレクトサービスでのインプロセスLRUキャッシュを検討。
- CDNでのエッジキャッシュはオリジン負荷を軽減。
  書き込みパスの最適化
分析イベントをバッチ処理。リダイレクトを分析にブロックさせない。

信頼性と可用性
マルチAZ

ロードバランサーの後ろで、複数のAZにAPI/リダイレクトサービスを実行。
キャッシュ: レプリケーション付きRedisクラスタ + 自動フェイルオーバー (またはマネージドRedis)。
DB: マルチAZレプリケーション。必要に応じてクォーラム読み取り/書き込み。
マルチリージョン (グローバルサービスに推奨)
アクティブ/アクティブリダイレクト: マッピングDBをリージョン間でレプリケート (DynamoDBグローバルテーブル / CassandraマルチDC)。
書き込みは最寄りのリージョンにルーティング可能。競合を解決:
- IDベースのキーの場合、衝突は起こりにくい。カスタムエイリアスはグローバルなユニーク性を必要とする — ドメインごとの「ホームリージョン」へのカスタムエイリアス作成のルーティング、または強く一貫したグローバルコーディネーションの使用 (まれなパス) で対応。
  フェイルオーバー
ヘルスチェック + GSLBによる自動トラフィックシフト。
ステートレスサービスにより、高速なスケーリングと置換が可能。
バックアップとDR
マッピングストアの継続的なバックアップ/スナップショット。
耐久性のあるオブジェクトストレージに生分析ログを保存。
段階的縮小
分析パイプラインがダウンした場合、リダイレクトを継続し、イベントをバッファリング (キュー保持期間) するか、サンプリングする。
キャッシュがダウンした場合、リダイレクトサービスはDBにフォールバックする (レイテンシ増加を予想するが、サービスは機能し続ける)。

レート制限と悪用防止
レート制限

作成エンドポイントに対するAPIキー/ユーザー/IPごとの制限 (APIゲートウェイでのトークンバケット/リーキーバケット)。
リダイレクトとは別の、より高い制限。CDN/WAFでフラッドから保護。
悪用対策
URL検証: スキーム (http/https) の許可リスト、最大長、内部IP範囲のブロック (SSRFスタイル) をプレビュー/スキャンコンポーネント用に使用。
マルウェア/フィッシング検出:
- セーフブラウジング/評判フィードとの統合。
- 非同期スキャン。信頼されていないユーザーに対しては、スキャンが成功するまでオプションで「保留中」状態にする。
カスタムエイリアスポリシー: 予約語、不適切語フィルタ、商標ポリシー。
ボット検出: デバイスフィンガープリントヒューリスティクス、疑わしい作成トラフィックに対するCAPTCHA。
リダイレクト保護:
- WAFルール、リダイレクトパターンの異常検出。
- キーごとのリダイレクトレートアラート。一時的なスロットリング。

容量/スループット計画の概要 (概算)

ピークリダイレクト: 世界全体で数百万リクエスト/秒を目標とする。
- CDNオフロード + リージョンキャッシュで大部分を処理 (ホットセットのキャッシュヒット率 >95%を目指す)。
- オリジンDBの読み取りは最小限に抑える。ミス <5%で設計。
書き込み: ピーク時で数万/秒。分散ID生成により中央のボトルネックを回避。
データ成長: 年間約12億件のマッピング。レプリケーションとインデックスのオーバーヘッドを持つ複数TBのストレージを計画。

実装開始点 (コンポーネントリスト)

APIゲートウェイ + 認証
短縮サービス
リダイレクトサービス (最適化され、依存関係は最小限)
各リージョンにRedisキャッシュクラスタ
マッピングDB (DynamoDB/Cassandra/Scylla)
IDジェネレーター (Snowflake) ライブラリ/サービス
Kafka/Kinesis + ストリームプロセッサ + OLAPストア
管理/管理サービス + ユーザーDB
モニタリング/アラート + WAF/CDN

判定

1位 | 勝者

勝利票

3 / 3

平均スコア

採点モデル Google Gemini 2.5 Flash

総合点

総評

URL短縮サービスのデザインは、非常に包括的で、構造化されており、技術的にも堅牢です。プロンプトの要件をすべて深く掘り下げており、実用的なソリューションと正当化されたトレードオフを提供しています。長所としては、詳細なアーキテクチャコンポーネント、堅牢なURLエンコーディング戦略、スキーマを備えた慎重なデータベース設計、スケーラビリティ、信頼性、および悪用防止に関する包括的なカバーが挙げられます。容量推定も効果的に統合されています。計画は明確かつ簡潔で、実装のための強固な基盤を提供しており、分散システム設計に関する優れた理解を示しています。

採点詳細を表示 ▼

設計の質

重み 30%

ハイレベルアーキテクチャは非常によく定義されており、APIゲートウェイ、書き込みおよび読み取り用の別個のサービス（Shorten、Redirect）、非同期分析パイプラインなどの明確なコンポーネントを区別しています。プライマリKVストア、キャッシュ、分析用のOLAPを備えた提案されたデータレイヤーは、ワークロードに適しています。作成およびリダイレクト操作のインタラクションフローは正確に記述されており、ホットリダイレクトパスにおけるキャッシュの重要な役割を強調し、グローバル分散を考慮しています。

完全性

重み 20%

回答は、プロンプトの7つの側面すべてに対して、完全かつ詳細な応答を提供します。機能要件と非機能要件、包括的なハイレベルアーキテクチャ、よく練られたURLエンコーディング戦略、スキーマとトレードオフを備えた詳細なデータベース設計、堅牢なスケーラビリティと信頼性メカニズム、および実用的な悪用防止戦略をカバーしています。おおよその容量推定と実装の開始点の包含は、その完全性をさらに高めています。

トレードオフの説明力

重み 20%

回答は、さまざまな技術的トレードオフについて強力な推論を示しています。URLエンコーディング戦略（DBシーケンス対分散ID対事前生成プール）のさまざまな選択肢の長所と短所を明確に議論し、数値ID + Base62の選択を正当化しています。プライマリデータストアのSQLとNoSQLの間の詳細な比較（スケーリングと一意制約に関するそれぞれの課題を含む）は優れています。キャッシュTTL戦略とマルチリージョン競合解決もよく考慮されています。

拡張性・信頼性

重み 20%

スケーラビリティは、詳細なトラフィック推定、包括的なキャッシュ戦略（Redis、CDN、ネガティブキャッシュ）、シャーディング/パーティショニング、およびホットキー管理を通じて徹底的に対処されています。信頼性も同様に、マルチAZおよびマルチリージョンデプロイメント、堅牢なレプリケーション、フェイルオーバーメカニズム、継続的なバックアップ、および段階的低下のための戦略によって十分にカバーされています。提案されたソリューションは実用的かつ堅牢であり、高負荷下での高可用性とパフォーマンスを保証します。

分かりやすさ

重み 10%

計画は非常に明確で、よく構造化されており、フォローしやすいです。明確なヘッダー、サブヘッダー、箇条書きの使用により、コンテンツは非常に消化しやすくなっています。言語は正確かつ技術的であり、シニアエンジニアに適しています。特定の技術推奨（例：DynamoDB、Cassandra、Snowflake、Redis、ClickHouse）はコンテキストとともに提供されており、設計の明確さと実用性をさらに高めています。

採点モデル Anthropic Claude Opus 4.6

総合点

総評

このシステム設計の回答は、7つの必須側面すべてを意味のある深さで網羅しており、優秀かつ包括的です。具体的なキャパシティ見積もり、根拠を伴う具体的な技術選定、詳細なスキーマ定義、トレードオフに関する詳細な議論が含まれています。回答は明確なセクションでよく構成されており、ホットキーやグレースフル・デグラデーションなどのエッジケースもカバーし、実践的な実装ガイダンスを提供しています。改善の余地としては、帯域幅に関するもう少し詳細な概算計算や、テキスト形式のアーキテクチャ図などが挙げられますが、全体としてはシニアエンジニアの出発点として適した非常に強力な回答です。

採点詳細を表示 ▼

設計の質

重み 30%

アーキテクチャは、関心の分離が明確であり、ステートレスなアプリケーションサービス、専用の読み書きパス、Kafkaを介した非同期分析パイプライン、キャッシュレイヤー、CDN/エッジなど、うまく設計されています。作成とリダイレクトの両方のインタラクションフローが明確に記述されています。Snowflakeのような分散ID生成の選択は、よく正当化されています。DynamoDBグローバルトランザクションまたはCassandraマルチDCによるマルチリージョンアクティブ/アクティブ設計は実践的です。唯一の軽微な欠点は、テキストベースの図がないことですが、フローのテキストによる説明は非常に明確です。

完全性

重み 20%

プロンプトの7つの側面すべてが徹底的に対処されています。機能要件には、コア機能とあったら良い機能の両方が含まれています。URLエンコーディング戦略は、複数のアプローチを長所/短所とともにカバーしています。データベース設計には、スキーマ、アクセスパターン、インデックスが含まれています。スケーラビリティは、キャッシング、シャーディング、ホットキー、CDNをカバーしています。信頼性は、マルチAZ、マルチリージョン、フェイルオーバー、バックアップ、グレースフル・デグラデーションをカバーしています。レート制限と不正利用防止が詳細に記述されています。キャパシティ見積もりには、書き込み/秒、読み取り/秒、ストレージ計算が含まれています。回答には、非機能要件と実装コンポーネントリストも含まれています。

トレードオフの説明力

重み 20%

全体を通して強力なトレードオフ分析が行われています。SQLとNoSQLは、このユースケースにおける具体的な長所と短所とともに議論されています。3つのID生成アプローチが比較され、SnowflakeのようなIDを推奨する明確な根拠が示されています。キャッシュTTL戦略は、期限切れのリンクと期限切れでないリンクを区別しています。回答は、301と302のリダイレクトコード、さまざまなデータ型での一貫性モデル、カスタムエイリアスのグローバル一意性と書き込みルーティングとのトレードオフについて議論しています。ネガティブキャッシュとホットキー緩和策の議論は、現実世界の認識を示しています。クロスリージョンレプリケーションの競合中の整合性保証について、もう少し深く掘り下げることができたかもしれません。

拡張性・信頼性

重み 20%

具体的な数値によるスケーラビリティのカバレッジは優秀です：平均3.86k書き込み/秒、平均386k読み取り/秒、ピーク計画の10倍、年間1.2TBのストレージ見積もり。キャッシュ戦略は、CDN、リージョナルRedisクラスター、インプロセスLRU、ネガティブキャッシュなど、よく考えられています。ホットキーの処理に対応しています。信頼性セクションは、マルチAZ、マルチリージョン、自動フェイルオーバー、分析またはキャッシュが失敗した場合のグレースフル・デグラデーション、継続的なバックアップをカバーしています。95%のキャッシュヒット率は現実的です。もう少し具体的な帯域幅計算とレイテンシ予算の内訳を含めることもできました。

分かりやすさ

重み 10%

回答は、プロンプトの7つの側面に一致する明確なセクションヘッダーで、例外的に整理されています。箇条書きとサブセクションにより、スキャンしやすくなっています。技術用語は正確に使用されています。機能要件からアーキテクチャ、実装の詳細への流れは論理的です。最後にあるキャパシティの概要がすべてをまとめています。最後にあるコンポーネントリストは、実践的な実装の出発点を提供します。シニアエンジニアにとって非常に読みやすく、実用的です。

採点モデル OpenAI GPT-5.4

総合点

総評

このシステムデザインの回答は、プロンプトで要求された主要な領域をすべて網羅しており、シニアエンジニアが構築に着手できるような構成になっている、強力で実用的なものです。特に、アーキテクチャ、キー生成、データベースの選択、キャッシング、マルチリージョンでの信頼性、不正利用防止に優れています。容量のセクションには有用な概算が含まれていますが、一部の計算や仮定は粗く、帯域幅、キャッシュサイズ、より明確な日次または地域別の内訳でさらに詳細化できる可能性があります。トレードオフはよく議論されていますが、いくつかの選択肢は、具体的な実装パスを完全に絞り込むのではなく、やや広範なままです。

採点詳細を表示 ▼

設計の質

重み 30%

アーキテクチャは、APIゲートウェイ、短縮サービス、リダイレクトサービス、キャッシュ、プライマリマッピングストア、分析パイプライン、不正利用検出、オブザーバビリティの明確な分離により、構造化され現実的です。リダイレクトパスは適切に最適化されており、分析は非同期で分離されているため、これは重要な実際の設計上の選択です。マルチAZおよびマルチリージョンに関する考慮事項は、合理的に対処されています。もう少し高いスコアを得るには、いくつかの同等のデータストアオプションをリストアップするのではなく、より決定的な最終アーキテクチャの選択が必要でした。

完全性

重み 20%

回答は、機能要件、高レベルアーキテクチャ、エンコーディング戦略、データベース設計、スケーラビリティとパフォーマンス、信頼性と可用性、レート制限と不正利用防止という、要求された7つの側面すべてに意味のある詳細で対処しています。また、要求された容量推定と実装の開始点も含まれています。軽微な欠点としては、厳密な有効期限強制メカニズムに関する議論が限定的であることと、リダイレクトステータスコードのセマンティクスに関する言及が短いことが挙げられます。

トレードオフの説明力

重み 20%

この応答は、ID生成アプローチ、SQL対NoSQL、キャッシュTTL、分析の一貫性、CDNキャッシュ、マルチリージョンセットアップでのカスタムエイリアスのユニークさなど、トレードオフに対する確かな理解を示しています。その理由は実践的であり、実際のシステムの問題を反映しています。いくつかのセクションで複数のテクノロジーの選択肢が提示され、単一の推奨設計とその結果に完全に絞り込まれていないため、いくつかのポイントを失っています。

拡張性・信頼性

重み 20%

スケーラビリティと可用性は、キャッシュファースト読み取り、ホットキー緩和、パーティショニング、レプリケーション、フェイルオーバー、キューベースの分析、および段階的低下に関する議論により、うまく処理されています。回答は、分析またはキャッシュコンポーネントが失敗した場合でも、リダイレクトを確実に利用可能にすることを正しく優先しています。容量計画は方向性としては良好ですが、QPSの導出、帯域幅の推定、バックエンド負荷に変換されたキャッシュヒットの仮定、および基本レコード推定以外のストレージオーバーヘッドの詳細化により、さらに強化できる可能性があります。

分かりやすさ

重み 10%

回答は非常に明確で、論理的に構成されており、スキャンしやすいです。見出しはプロンプトに直接対応しており、箇条書きは簡潔かつ有益で、最終的な実装チェックリストは役立ちます。曖昧なエッセイというよりは、実用的なエンジニアリング計画のように読めます。唯一の小さな問題は、いくつかのセクションに多くのオプションが密集しており、決定性がわずかに低下していることです。

回答B: Google Gemini 2.5 Pro

1. 機能要件

コア機能：
- URL短縮: ユーザーは長いURLを送信し、一意の短いURLを受け取ることができます。
- URLリダイレクト: 短いURLにアクセスすると、ユーザーは301（恒久的）リダイレクトで元の長いURLにリダイレクトされます。
拡張機能：
- カスタムURL: ユーザーは短いURLのカスタムエイリアスを選択できます（例：short.co/my-event）。
- URL有効期限: ユーザーは短いURLの有効期限（時間/日付）を設定でき、それを過ぎるとリダイレクトされなくなります。
- 分析: サービスは、各リンクの総クリック数、参照元、クリックの地理的位置などの基本的な指標を追跡します。
  *...

全文を表示 ▼

1. 機能要件

コア機能：
- URL短縮: ユーザーは長いURLを送信し、一意の短いURLを受け取ることができます。
- URLリダイレクト: 短いURLにアクセスすると、ユーザーは301（恒久的）リダイレクトで元の長いURLにリダイレクトされます。
拡張機能：
- カスタムURL: ユーザーは短いURLのカスタムエイリアスを選択できます（例：short.co/my-event）。
- URL有効期限: ユーザーは短いURLの有効期限（時間/日付）を設定でき、それを過ぎるとリダイレクトされなくなります。
- 分析: サービスは、各リンクの総クリック数、参照元、クリックの地理的位置などの基本的な指標を追跡します。
- APIアクセス: 短縮サービスをアプリケーションに統合するためのREST APIが開発者向けに提供されます。
- ユーザーアカウント: 登録ユーザーはリンクを管理し、分析を表示し、より高いAPIレート制限にアクセスできます。

2. 高レベルアーキテクチャ

システムは、高い可用性とスケーラビリティを備え、読み取りパスと書き込みパスを明確に分離するように設計されています。

ロードバランサー (LB): 複数のWebサーバーに受信トラフィックを分散させ、単一のサーバーがボトルネックになるのを防ぎます。SSL終端を処理します。
Web/APIサーバー: アプリケーションロジックを実行するステートレスサーバーのフリートです。これらは2つの主要なリクエストを処理します：
- POST /api/v1/url (書き込みパス): 新しい短いURLを作成します。
- GET /{short_key} (読み取りパス): 長いURLにリダイレクトします。
キー生成サービス (KGS): 一意の短いキーを生成する専用のマイクロサービスです。書き込みパスの低遅延を保証するために、キーを事前生成してキューに保存します。
キャッシュ: アプリケーションサーバーとデータベースの間に、分散インメモリキャッシュ（例：Redis Cluster）が配置されます。頻繁にアクセスされるリンクのshort_keyとlong_urlのマッピングを格納し、非常に低い遅延でリダイレクトを提供します。
データベース: すべてのURLマッピングとユーザーデータのプライマリデータストアです。
分析パイプライン: リダイレクトイベントはメッセージキュー（例：Kafka）に公開されます。別のサービスがこれらのイベントを消費し、データを集計し、分析クエリのためにデータウェアハウス（例：ClickHouseまたはAWS Redshift）に格納します。

インタラクションフロー（リダイレクト）：
クライアント -> ロードバランサー -> APIサーバー -> キャッシュ (Redis)。キャッシュヒットの場合はリダイレクトを返します。キャッシュミスの場合 -> データベース -> APIサーバー -> クライアント。その後、マッピングは後続のリクエストのためにキャッシュに書き込まれます。

3. URLエンコーディング戦略

Base62エンコーディング戦略と一意のIDジェネレーターを組み合わせて使用します。

アプローチ: キー生成サービス (KGS) が、グローバルな64ビットカウンタ（例：専用SQLデータベースシーケンス、Zookeeper、またはカスタムサービスを使用して）を管理します。
プロセス：
1. アプリケーションサーバーがリンク作成のためにKGSに一意のIDを要求します。
2. KGSは一意の番号（例：10001）を提供します。
3. アプリケーションサーバーは、この数値をBase62文字列（[a-zA-Z0-9]）に変換します。例：Base62での10001は2k1です。
4. 固定長を確保し、短く推測可能なキーを回避するために、7文字の長さを採用できます。64ビットカウンタは、十分な一意のID（2^64）を提供し、Base62文字列にマッピングできます。7文字のBase62文字列は、62^7（約3.5兆）の一意のURLを表すことができ、これは私たちの規模には十分です。
衝突処理: このアプローチは一意性を保証するため、設計上衝突は不可能です。これは、衝突を生成し追加チェックを必要とする可能性のある長いURLのハッシュ化よりも優れています。

4. データベース設計

大規模な読み取りスループットとスケーラビリティの要件を考慮すると、Apache CassandraやAmazon DynamoDBのようなNoSQLデータベースが理想的な選択肢です。

NoSQLの理由？: 主なアクセスパターンは単純なキーバリュールックアップ（short_key -> long_url）です。NoSQLデータベースは、このパターンに対する水平スケーリング、高可用性、低遅延の読み取りに優れており、100:1の読み書き比率に最適です。
SQLのトレードオフ: シャード化されたSQLデータベース（例：Citusを使用したPostgreSQL）も機能しますが、このレベルでのシャード化とスケーリングにおいて、より多くの運用上の複雑さが生じます。

コアテーブルスキーマ（Cassandra/DynamoDB風）：

テーブル名: urls
主キー: short_key（これはパーティションキーとして機能し、データがクラスター全体に均等に分散されることを保証します）。
列:
- short_key (text, Partition Key)
- long_url (text)
- user_id (uuid)
- created_at (timestamp)
- expires_at (timestamp) - これを基に、行のTime-To-Live (TTL) を設定して自動クリーンアップできます。

5. スケーラビリティとパフォーマンス

容量見積もり：
- 書き込み: 月間1億URL ≈ 秒間40書き込み（平均）。
- 読み取り: 月間100億読み取り ≈ 秒間3,850読み取り（平均）。ピークトラフィックはこれの10〜20倍になる可能性があります。
- ストレージ: 月間1億URL * 12ヶ月 * 5年 = 60億URL。エントリあたり約500バイトとすると、約3TBのデータになります。
読み取りパスのスケーリング：
- キャッシング: これが最も重要なコンポーネントです。マルチレイヤーキャッシュを使用します。
  - CDNキャッシュ: エッジでリダイレクトをキャッシュするためにCDN（例：Cloudflare）を使用します。これにより、人気のあるリンクのトラフィックのかなりの割合をオフロードできます。
  - 分散キャッシュ: Redisのようなインメモリキャッシュを使用します。月間100億読み取りを考えると、多くのURLが「ホット」になります。最もアクティブなURLの10〜20％をキャッシュするだけで、データベースの読み取り負荷を80〜90％以上削減できます。
- データベースシャーディング: short_keyをパーティションキーとするNoSQLの選択により、これが自然に処理されます。データベースクラスターにノードを追加することで、ストレージとスループットの両方を水平にスケールできます。

6. 信頼性と可用性

冗長性: すべてのコンポーネントは、複数のアベイラビリティゾーン (AZ) にまたがってデプロイされます。
- ロードバランサー、APIサーバー: 少なくとも2つのAZにまたがるオートスケーリンググループにデプロイされます。
- キャッシュ (Redis): 異なるAZにレプリカを持つクラスター構成でデプロイされます。
- データベース (Cassandra): データベースは、レプリケーションファクター3で構成され、AZ障害時のデータ耐久性と可用性を確保するために、異なるAZにレプリカが格納されます。
フェイルオーバー: 自動フェイルオーバーメカニズムが導入されます。ロードバランサーは、正常でないインスタンスから自動的にトラフィックをルーティングします。マネージドデータベースサービスは通常、データベースのフェイルオーバーを自動的に処理します。
データバックアップ: 災害復旧のために、データベースのスナップショットを定期的に取得し、別のリージョンに保存します。

7. レート制限と悪用防止

レート制限: APIゲートウェイまたはRedisのようなインメモリストアを使用したアプリケーションロジックで実装されます。
- 制限は、匿名ユーザーの場合はIPアドレス（例：1分あたり10件の作成）、登録ユーザーの場合はAPIキー（異なるティアあり）に基づいて行われます。
悪用防止：
- 悪意のあるURLスキャン: Google Safe Browsing APIのようなサービスと統合し、送信されたすべてのlong_urlを悪意のあるサイトのブロックリストと照合します。
- CAPTCHA: 高頻度の送信パターンを示す匿名ユーザー向け。
- ブラックリスト: スパムで知られるドメインとユーザーアカウントの内部ブラックリストを維持します。

判定

2位

勝利票

0 / 3

平均スコア

採点モデル Google Gemini 2.5 Flash

総合点

総評

URL短縮サービスの設計は、例外的に構造化されており、包括的です。プロンプトの要件をすべて、かなりの技術的深さと実践的な考慮事項をもって満たしています。強みとしては、キー生成サービス（KGS）のような専用サービスを備えた明確なアーキテクチャ、衝突を回避する堅牢なURLエンコーディング戦略、主要データストアとしてのNoSQLの正当な選択が挙げられます。容量推定は正確であり、マルチレイヤーキャッシングやマルチAZデプロイメントを含むスケーラビリティと信頼性対策は非常に強力です。この計画は非常に実践的であり、実装のための強固な基盤を提供します。

採点詳細を表示 ▼

設計の質

重み 30%

ハイレベルアーキテクチャは明確に定義されており、ロードバランサー、Web/APIサーバー、キー生成サービス（KGS）、キャッシュ、データベース、分析パイプラインなどのコンポーネントに論理的に関心が分離されています。リダイレクトのインタラクションフローは明確に説明されており、高トラフィックの読み取りを効率的に処理するための堅牢な設計を示しています。専用KGSの含有は、強力なアーキテクチャ上の決定です。

完全性

重み 20%

プロンプトの7つの側面すべてが徹底的に対処されています。カスタムURLや分析などの拡張機能を含む機能要件から、データベース設計、スケーラビリティ、信頼性、および不正利用防止の詳細なセクションまで、回答は主要な点を見落としていません。各セクションの詳細度は称賛に値します。

トレードオフの説明力

重み 20%

この回答は、設計上の選択について強力な正当化を提供します。ハッシュ化ではなく一意IDジェネレーターを使用したBase62エンコーディングを使用する根拠はよく説明されており、衝突の回避の利点を強調しています。シャーディングされたSQLよりもNoSQLデータベース（Cassandra/DynamoDB）を選択した理由は、読み取り中心のアクセスパターンと水平スケーラビリティのニーズに基づいて明確に説明されています。マルチレイヤーキャッシングに関する議論も、トレードオフの理解を良好に示しています。

拡張性・信頼性

重み 20%

容量推定は、読み書きおよびストレージの両方について正確かつ適切に計算されています。マルチレイヤーキャッシング（CDNおよびRedis）やNoSQLソリューションを使用したデータベースシャーディングなど、提案されたスケーラビリティ戦略は優れています。信頼性も、アベイラビリティゾーン全体での冗長性、自動フェイルオーバーメカニズム、および定期的なデータバックアップにより徹底的にカバーされており、サービスの高い可用性を確保しています。

分かりやすさ

重み 10%

この計画は、明確なヘッダーと箇条書きを使用して、例外的に明確でよく構造化されています。言語は正確であり、技術的な概念は理解しやすい方法で説明されています。具体的な技術推奨（例：Redis、Cassandra、Kafka）とその簡単な正当化は、設計の明確さと実用性を高め、実装の非常に実用的な出発点となっています。

採点モデル Anthropic Claude Opus 4.6

総合点

総評

この回答は、プロンプトの7つの側面すべてに意味のある詳細で対応しており、強力で構造化されています。現実世界のシステム設計におけるトレードオフをしっかりと理解しており、具体的な技術推奨事項、容量推定、現実的で実装可能な設計を提示しています。主な弱点は、容量推定セクションがより詳細である可能性があること（例：帯域幅計算が欠落している）、分析のための301と302リダイレクトのトレードオフが議論されていないこと、KGS設計が、単一障害点となるのを回避するためにカウンターが複数のインスタンスに分散される方法について、さらに詳しく説明できることです。全体として、これはシニアエンジニアが実際に開始点として使用できる計画です。

採点詳細を表示 ▼

設計の質

重み 30%

アーキテクチャは、読み取りパスと書き込みパスの明確な分離、専用のキー生成サービス（KGS）、Kafkaを使用した分析パイプライン、CDNを含む多層キャッシュにより、適切に設計されています。インタラクションフローが明確に説明されています。KGSを備えたカウンターベースのBase62エンコーディングの選択は、衝突を排除する強力な設計上の決定です。マイナーな弱点：KGS自体が単一障害点となる可能性があり、回答はKGSが高可用性である方法や、複数のKGSインスタンスがどのように調整されるか（例：範囲ベースの割り当て）を深く議論していません。KafkaとClickHouseを備えた分析パイプラインは、実用的で適切に選択された追加機能です。

完全性

重み 20%

プロンプトの7つの側面すべてが、単に言及するだけでなく、意味のある詳細で対応されています。機能要件は、コア機能と拡張機能をカバーしています。アーキテクチャ、エンコーディング戦略、データベース設計、スケーラビリティ、信頼性、および不正利用防止セクションはすべて実質的です。容量推定が含まれています。ただし、帯域幅推定が欠落しており、回答は301（永続）リダイレクトと302（一時）リダイレクトのトレードオフについて議論していません。これは、301リダイレクトはブラウザによってキャッシュされ、サーバーをバイパスしてクリック追跡を損なう可能性があるため、分析にとって重要です。

トレードオフの説明力

重み 20%

回答は、いくつかの重要なトレードオフについて議論しています：カウンターベースのID生成対ハッシュ（カウンターアプローチの明確な正当化）、NoSQL対SQL（アクセスパターンと水平スケーリングに関する理由）、およびキャッシュ戦略。CassandraのTTL機能（有効期限）は、実践的な洞察です。ただし、いくつかのトレードオフは言及されていますが、深く探求されていません。たとえば、SQLのトレードオフはいくぶん早く却下されています。301と302リダイレクトのトレードオフはまったく議論されておらず、回答が301リダイレクトを指定し、同時に分析を必要としていることを考えると、注目すべき省略です。Cassandraの整合性モデルのトレードオフ（結果整合性対強整合性）は議論されていません。

拡張性・信頼性

重み 20%

スケーラビリティセクションは、多層キャッシュ（CDN + Redis）、パーティションキーによるデータベースシャーディング、書き込み、読み取り、ストレージの明確な容量推定により、堅実です。信頼性セクションは、マルチAZデプロイメント、レプリケーションファクター3、オートスケーリンググループ、および災害復旧バックアップをカバーしています。80〜90％のキャッシュヒット率がデータベース負荷を軽減するという推定は現実的です。ピークトラフィックの考慮事項（平均の10〜20倍）は、実践的な思考を示しています。マイナーなギャップ：リードレプリカに関する議論がなく、帯域幅推定がなく、KGSの可用性/冗長性は、重要なコンポーネントであるにもかかわらず、信頼性セクションで対処されていません。

分かりやすさ

重み 10%

回答は、明確な見出し、番号付きセクション、箇条書きがあり、非常に整理されており、フォローしやすいです。リダイレクトのインタラクションフローは簡潔に説明されています。スキーマは、明確で読みやすい形式で提示されています。技術選択は、Redis、Cassandra、DynamoDB、Kafka、ClickHouse、Cloudflareのように具体的に名前が付けられています。記述は全体的に簡潔かつプロフェッショナルであり、実装の開始点として非常に適しています。

採点モデル OpenAI GPT-5.4

総合点

総評

これは、プロンプトの主要な領域をすべて良好な構造と現実的なコンポーネント選択でカバーする、堅実で実用的なシステム設計です。アーキテクチャは一貫性があり、読み書きパスは理解可能で、キャッシュ、非同期分析、マルチAZデプロイメントの使用は適切です。最も強力な部分は、ハイレベルアーキテクチャ、エンコーディングアプローチ、および実践的な不正防止のアイデアです。主な弱点は、一部のトレードオフの深さが限られていることと、容量分析が不完全であることです。数学は部分的であり、ストレージの仮定は分解されておらず、ピーク推定は概算であり、リダイレクトのセマンティクス、ホットキーの処理、カスタムエイリアスのユニークネス、一貫性の選択、リードレプリカ、キー生成サービスの障害モードなどの重要な詳細は完全には検討されていません。

採点詳細を表示 ▼

設計の質

重み 30%

提案されたアーキテクチャは強力で実装可能であり、APIレイヤー、キャッシュ、データベース、キー生成、分析パイプラインの明確な分離がなされています。リダイレクトフローは合理的であり、Kafkaと分析ストアの使用は、本番環境を意識した良い選択です。しかし、カスタムエイリアスがアトミックに予約される方法、キー生成サービスが単一障害点になるのをどのように回避するか、リダイレクトはエッジまたはアプリ層から直接提供されるべきか、期限切れまたは削除されたリンクがキャッシュからどのように無効化されるかなど、大規模運用で重要となるいくつかのアーキテクチャの詳細は欠けています。

完全性

重み 20%

回答は、要求された7つの側面すべてに対応しており、機能要件、アーキテクチャ、エンコーディング、データベース選択、スケーラビリティ、信頼性、不正防止が含まれています。また、容量推定と基本的なスキーマも含まれています。分析ストレージスキーマ、ユーザー/アカウントデータの設計、リダイレクト時の有効期限の動作、およびカスタムURLの衝突やエイリアス競合のより明確な処理が完全に詳細化されていないため、完全性はわずかに低下しています。

トレードオフの説明力

重み 20%

キーと値のルックアップのためのNoSQLと、カウンターおよびBase62対ハッシュの選択には、まともな理由付けがあります。回答は、ハッシュとの衝突トレードオフを正しく指摘し、シャーディングされたSQLの運用上の複雑さを強調しています。それでも、トレードオフの議論はやや表面的であり続けています。一貫性の要件、レプリケーションによる書き込み増幅、事前生成キー対オンデマンドID割り当ての長所と短所、さまざまなデータベースでのTTL動作の限界、SQLのトランザクション機能（ユーザー所有権やカスタムエイリアスなど）の実用的な長所と短所については議論されていません。

拡張性・信頼性

重み 20%

設計は、RedisおよびCDNによる読み込みのスケーリング、NoSQLでの水平スケーリング、AZをまたぐレプリケーション、バックアップ、自動フェイルオーバーに関する良好な認識を示しています。概算のスループット数値は方向性としては正しく、ピークトラフィックも認識されています。容量セクションが完全に開発されておらず、帯域幅計算、キャッシュサイジングロジック、レプリケーション調整後のストレージ推定、およびより厳密なQPS計画が欠けているため、スコアは伸び悩んでいます。信頼性の議論も、リージョンフェイルオーバー戦略、ホットパーティションのリスク、Redisおよびキー生成パスの詳細な障害処理をカバーしていません。

分かりやすさ

重み 10%

回答はよく整理されており、理解しやすく、プロンプトのセクションに直接構造化されています。コンポーネントリストとリダイレクトフローは特に明確であり、設計はシニアエンジニアがレビューしやすいものになっています。一部のセクションが簡潔であり、より明確な正当化やスキーマの詳細があれば精度が向上する可能性があるため、わずかに減点しています。

比較結果サマリー

最終順位は、採点者ごとの順位集約（平均順位 + ボルダ方式の同点処理）で決定します。平均点は参考表示です。

採点者数: 3

勝者 OpenAI GPT-5.2

勝利票

3 / 3

平均点

この回答を見る

Google Gemini 2.5 Pro

勝利票

0 / 3

平均点

この回答を見る

このモデル組み合わせの通算戦績を見る

採点結果

採点モデル OpenAI GPT-5.4

GPT-5.2 勝者 92

Gemini 2.5 Pro 84

採点モデル Anthropic Claude Opus 4.6

GPT-5.2 勝者 92

Gemini 2.5 Pro 83

採点モデル Google Gemini 2.5 Flash

GPT-5.2 勝者 96

Gemini 2.5 Pro 94

URL短縮サービスの設計

お題概要

お題本文

回答

回答A: OpenAI GPT-5.2

回答B: Google Gemini 2.5 Pro

1. 機能要件

1. 機能要件

2. 高レベルアーキテクチャ

3. URLエンコーディング戦略

4. データベース設計

5. スケーラビリティとパフォーマンス

6. 信頼性と可用性

7. レート制限と悪用防止

比較結果サマリー

採点結果

関連お題

廃車後の電気自動車バッテリーの革新的活用法

染色体非分離の機構とその影響を説明せよ

都市ヒートアイランドの歴史と科学に関する文章を要約する

製品リコール決定における証拠の評価

重大なプロジェクト遅延を説明するクライアント向けメールを書く

スライディングウィンドウと優先度付きキューを備えた同時実行レートリミッタを実装する

突発的な洪水事象に対する緊急避難所設営計画

週4日勤務制の導入を提案する説得力のある社内提案書を作成する

関連リンク