MarkdownサブセットをHTMLに変換するコンバータ

このプログラミングベンチマークに対する各AIの回答と比較結果を確認できます。

いいね・お気に入り機能を使うにはログインまたは新規登録が必要です。新規登録

X f L

お題概要

比較ジャンル

プログラミング

お題作成モデルお題作成者は、対応プロバイダ各社の上位お題生成モデル候補の中からランダムに選ばれます。

Google Gemini 2.5 Pro

回答モデルこのお題では、お題作成者と同じプロバイダのモデルは回答対象から除外されます。

回答A Anthropic Claude Opus 4.7

回答B OpenAI GPT-5.4

採点モデル採点は回答モデルを除いた候補から3モデルで実施します。3モデルは異なる3プロバイダから選び、上位モデルを最低1つ含め、軽量モデルは採点者に選びません。

OpenAI GPT-5.2 Anthropic Claude Sonnet 4.6 Google Gemini 2.5 Pro

お題本文

Python関数 markdown_to_html(markdown_text: str) -> str を実装してください。この関数は、特定のサブセットのMarkdownを含む文字列を対応するHTML表現に変換します。

関数は次の機能をサポートする必要があります：

ブロック要素:

見出し（Headers）： # から ###### で始まる行はそれぞれ <h1> から <h6> タグに変換すること。
順不同リスト（Unordered Lists）： - で始まる行は <ul> と <li> タグに変換すること。レベルごとに2つのスペースでインデントされたネストされたリストをサポートすること。リストは...

さらに表示 ▼

関数は次の機能をサポートする必要があります：

ブロック要素:

見出し（Headers）： # から ###### で始まる行はそれぞれ <h1> から <h6> タグに変換すること。
順不同リスト（Unordered Lists）： - で始まる行は <ul> と <li> タグに変換すること。レベルごとに2つのスペースでインデントされたネストされたリストをサポートすること。リストは空行または別のブロック要素によって終了する。
コードブロック（Code Blocks）： 三連バックティック（）で囲まれた内容は `<pre><code>...</code></pre>` に変換すること。開始バックティック上の言語指定（例：python）は無視すること。コードブロック内部では他のMarkdown処理は行わないこと。
段落（Paragraphs）： その他のテキストはすべて <p> タグで囲むこと。連続するテキスト行は同じ段落に属する。段落は1行以上の空行で区切られる。

インライン要素:

太字かつ斜体（Bold & Italic）： ***text*** は <strong><em>text</em></strong> に変換すること。
太字（Bold）： **text** は <strong>text</strong> に変換すること。
斜体（Italic）： *text* は <em>text</em> に変換すること。

ルールと制約:

インライン要素は見出しやリスト項目内でネストできる。
パーサーは未終了のインラインタグなどの壊れたまたはトリッキーな入力に対して頑健であるべきである。例えば、*italic は <p>*italic</p> としてレンダリングされるべきである。
インライン要素の優先順位は *** が最優先、次に **、最後に * とする。
入力は単一の複数行文字列であると想定する。
リンク、画像、引用（blockquote）、番号付きリストなど、ここに明記されていない他のMarkdown機能は実装しないこと。
出力されるHTMLは完全なドキュメントである必要はない（<html> や <body> タグは不要）。

Example Input:

# Header 1

This is a paragraph with **bold** and *italic* text.
This is the same paragraph.

- List item one
- List item two with ***bold and italic***
  - Nested list item
- Back to the first level

```python
def hello():
    print("Hello, World!")

補足情報

このタスクは、単純で定義の明確な言語のパーサーを書く能力をテストします。リスト内やコードブロック内といった異なる状態の扱い、ブロックレベル要素とインライン要素の両方の解析、ネスト構造の管理などを慎重に行う必要があります。成功する解法は優れたアルゴリズム設計、エッジケースへの配慮、堅牢なコード構造を示します。

採点方針

高品質な解答は、指定されたすべての機能を正しく実装します。ネストされたリスト、ネストされたインライン書式、壊れた構文のようなエッジケースを含め、頑健に処理できることが期待されます。コードは構造化されて読みやすく、効率的であるべきです。

正確性（Correctness）： 生成されるHTMLは、すべての規則に従ってMarkdown入力を正確に反映していなければならない。リストの正しいネストやインラインスタイルの正しいネストに特に注意すること。
頑健性（Robustness）： トリッキーまたは壊れた入力でもコードがクラッシュしないこと。例えば、閉じられていない * はリテラル文字として扱われるべきである。
コード品質（Code Quality）： 解法はよく整理され、理解しやすいこと。正規表現の使用は有効なアプローチだが、状態機械（state-machine）など他の解析手法も許容される。アルゴリズムの選択と実装品質が評価される。
完全性（Completeness）： 指定されたすべての機能（見出し、段落、ネストを含むリスト、コードブロック、および3種類のインラインスタイル）が実装されていること。

回答

回答A: Anthropic Claude Opus 4.7

import re
import html

def markdown_to_html(markdown_text: str) -> str:
"""MarkdownのサブセットをHTMLに変換します。

サポートされている機能：
  - ヘッダー（# .. ######）
  - 2スペースネストの順序なしリスト
  - フェンスされたコードブロック（```）
  - 段落
  - インライン：***太字+イタリック***、**太字**、*イタリック*
"""

def escape(text: str) -> str:
    # HTMLに敏感な文字をエスケープします。
    return html.escape(text, quote=False)

def process_inline(text: str) -> str:
    """インラインマークダウンを処理します。エスケープ済みのテキストでも機能します。...

全文を表示 ▼

import re
import html

def markdown_to_html(markdown_text: str) -> str:
"""MarkdownのサブセットをHTMLに変換します。

サポートされている機能：
  - ヘッダー（# .. ######）
  - 2スペースネストの順序なしリスト
  - フェンスされたコードブロック（```）
  - 段落
  - インライン：***太字+イタリック***、**太字**、*イタリック*
"""

def escape(text: str) -> str:
    # HTMLに敏感な文字をエスケープします。
    return html.escape(text, quote=False)

def process_inline(text: str) -> str:
    """インラインマークダウンを処理します。エスケープ済みのテキストでも機能します。
    マーカー*, **, *** はエスケープされた文字を含まないためです。
    """
    escaped = escape(text)

    # 優先順位：***、次に**、次に*。
    # 非欲張りマッチを使用し、非空白境界を緩やかに要求します。
    # ***text***
    escaped = re.sub(
        r'\*\*\*(.+?)\*\*\*',
        r'<strong><em>\1</em></strong>',
        escaped,
    )
    # **text**
    escaped = re.sub(
        r'\*\*(.+?)\*\*',
        r'<strong>\1</strong>',
        escaped,
    )
    # *text*
    escaped = re.sub(
        r'\*(.+?)\*',
        r'<em>\1</em>',
        escaped,
    )
    return escaped

lines = markdown_text.split('\n')
output = []

# 状態トラッカー
in_code_block = False
code_buffer = []

paragraph_buffer = []

# リストスタック：現在開いているインデントレベル（0、1、2、...）のリスト
list_stack = []

def flush_paragraph():
    if paragraph_buffer:
        content = ' '.join(paragraph_buffer)
        output.append(f'<p>{process_inline(content)}</p>')
        paragraph_buffer.clear()

def close_lists_to(level):
    """`level`個のリストのみが開いた状態になるまでリストを閉じます（level = 開いている<ul>の数）。"""
    while len(list_stack) > level:
        output.append('</li>')
        output.append('</ul>')
        list_stack.pop()
        if list_stack:
            # ネストされたリストを閉じた後、親<li>は開いたままです。
            # 次の兄弟が開始するか、完全に閉じる際に閉じます。
            pass

def close_all_lists():
    while list_stack:
        output.append('</li>')
        output.append('</ul>')
        list_stack.pop()

i = 0
while i < len(lines):
    line = lines[i]

    # コードブロックの処理
    if in_code_block:
        if line.strip().startswith('```'):
            # コードブロックの終了
            code_content = '\n'.join(code_buffer)
            output.append(f'<pre><code>{escape(code_content)}</code></pre>')
            code_buffer = []
            in_code_block = False
        else:
            code_buffer.append(line)
        i += 1
        continue

    # コードブロックの開始をチェック
    stripped = line.strip()
    if stripped.startswith('```'):
        flush_paragraph()
        close_all_lists()
        in_code_block = True
        i += 1
        continue

    # 空行
    if stripped == '':
        flush_paragraph()
        close_all_lists()
        i += 1
        continue

    # ヘッダー？
    header_match = re.match(r'^(#{1,6}) +(.*)$', line)
    if header_match:
        flush_paragraph()
        close_all_lists()
        level = len(header_match.group(1))
        content = header_match.group(2).rstrip()
        output.append(f'<h{level}>{process_inline(content)}</h{level}>')
        i += 1
        continue

    # リスト項目？
    # 先頭のスペース（ネストには偶数である必要がある）と「- 」に一致
    list_match = re.match(r'^( *)- +(.*)$', line)
    if list_match:
        flush_paragraph()
        indent_spaces = len(list_match.group(1))
        # インデントが2の倍数である場合にのみ有効なネストレベルとして扱う
        indent_level = indent_spaces // 2
        content = list_match.group(2)

        # リストスタックを調整
        if not list_stack:
            # 新規開始：最初のリストはレベル0である必要がある
            indent_level = 0
            output.append('<ul>')
            list_stack.append(0)
            output.append(f'<li>{process_inline(content)}')
        else:
            current_depth = len(list_stack) - 1  # トップインデックス
            if indent_level > current_depth:
                # 新しいネストされたリストを開く（一度に1レベル深くするだけ）
                indent_level = current_depth + 1
                output.append('<ul>')
                list_stack.append(indent_level)
                output.append(f'<li>{process_inline(content)}')
            elif indent_level == current_depth:
                # 同じレベルの兄弟：前の<li>を閉じる
                output.append('</li>')
                output.append(f'<li>{process_inline(content)}')
            else:
                # デデント：深いリストを閉じる
                while len(list_stack) - 1 > indent_level:
                    output.append('</li>')
                    output.append('</ul>')
                    list_stack.pop()
                    # このネストされたリストが含まれていた親<li>も閉じる
                    output.append('</li>')
                # 現在同じレベル：兄弟を追加
                output.append(f'<li>{process_inline(content)}')
        i += 1
        continue

    # それ以外の場合は、段落行です
    if list_stack:
        close_all_lists()
    paragraph_buffer.append(line.strip())
    i += 1

# 入力の終了：すべてフラッシュ
if in_code_block:
    # 未クローズのコードブロック：持っているものをすべて発行
    code_content = '\n'.join(code_buffer)
    output.append(f'<pre><code>{escape(code_content)}</code></pre>')
flush_paragraph()
close_all_lists()

return '\n'.join(output)

if name == 'main':
sample = '''# Header 1

This is a paragraph with bold and italic text.
This is the same paragraph.

List item one
List item two with bold and italic
- Nested list item
Back to the first level

def hello():
    print("Hello, World!")

'''
print(markdown_to_html(sample))

判定

2位

勝利票

0 / 3

平均スコア

採点モデル Anthropic Claude Sonnet 4.6

総合点

総評

回答Aは、必要な機能をすべて実装しており、構造化され、コメントも明確です。インラインパーサーは、優先順位に従って正規表現の置換を使用しており、ほとんどのケースで機能しますが、微妙な欠点があります。HTML文字をインラインパターンに適用する前にエスケープしないため、エスケープが最初に適用されるとパターンに干渉する可能性があります。より重要なのは、リストの終了ロジックにデデント時のバグがあることです。同じレベルで再オープンする前に、親アイテムに対して余分な</li>を出力するため、不正なHTMLが生成される可能性があります。コードブロックの検出は、必要以上に緩いline.strip().startswith('```')を使用しています。全体として、リスト処理におけるエッジケースの問題はあるものの、堅実な試みです。

採点詳細を表示 ▼

正確さ

重み 35%

回答Aは、ヘッダー、段落、コードブロック、および基本的なインラインフォーマットを正しく処理します。しかし、リストのデデントロジックにはバグがあります。ネストされたリストを閉じるときに、親アイテムに対して余分な`</li>`を出力するため、不正なHTMLが生成される可能性があります。インライン正規表現アプローチは、`*italic`のような閉じられていないマーカーに対して、テキスト内の後続の`*`と意図しない境界で一致する可能性もあります。

完全性

重み 20%

必要な機能はすべて実装されています：ヘッダー（h1-h6）、ネストされた順序なしリスト、言語指定子を無視したコードブロック、段落、および3つのインラインスタイル（太字+斜体、太字、斜体）すべて。タスクのメインサンプルが処理されます。

コード品質

重み 20%

コードは、明確なヘルパー関数と良好なコメントで整理されています。ドキュメンテーション文字列は役立ちます。しかし、リスト管理ロジックはやや複雑で、微妙なバグがあります。インライン解析のための正規表現アプローチはよりシンプルですが、堅牢性に欠けます。`close_lists_to`関数は定義されていますが、メインループでは使用されていません（`close_all_lists`のみが使用されています）。

実用性

重み 15%

このソリューションは一般的なケースで機能し、サンプル入力を含む実行可能な`__main__`ブロックが含まれており、テストに役立ちます。しかし、リストのネストのバグと潜在的なインライン正規表現の問題により、エッジケースでの実用的な信頼性が低下します。

指示遵守

重み 10%

指定されたすべての指示に従っています：正しい関数シグネチャ、必要なすべての機能のサポート、指定されたインライン優先順位の処理、サポートされていない機能の実装なし、および閉じられていないタグの処理（ただし、正規表現では不完全）。HTMLエスケープが適用されています。

採点モデル OpenAI GPT-5.2

総合点

総評

単純なステートマシンと正規表現ベースのインライン置換により、必須のブロックタイプとインラインフォーマットを実装し、コードブロック内のHTMLを含むHTMLを正しくエスケープしています。ただし、リスト生成には複数の構造的な問題があります。無効なネストにつながる可能性のあるおよびシーケンスを出力し、デデント（余分な）を誤って処理し、親内にないネストされたを開く可能性があります。正規表現によるインライン処理は、トリッキー/不正なケース（例：太字 イタリックのような重複マーカー）に対して堅牢ではなく、インライン要素の再帰的なネストも要求/期待されるようにはサポートしていません。

採点詳細を表示 ▼

正確さ

重み 35%

基本的なヘッダー/段落/コードブロックと単純な強調表示については正しいですが、リストのネスト/終了は頻繁に無効です（余分な</li>、ネストされた<ul>の配置の問題）。また、正規表現による強調表示は、重複/ネストされたケース（例：**太字 *イタリック***）を誤って処理する可能性があります。

完全性

重み 20%

要求されたすべての機能カテゴリをカバーしていますが、リストのネストサポートは信頼性が低く、インラインのネストは単純なパターンを超えて実際にはサポートされていないため、実質的な完全性が低下しています。

コード品質

重み 20%

可読性とモジュール性は高いですが、リストスタックのロジックは未使用/効果のないヘルパー（close_lists_to）と壊れやすい状態遷移により複雑化しており、正規表現の多用は明確さと堅牢性を低下させています。

実用性

重み 15%

単純な入力には役立ちますが、無効なリストHTMLと強調表示のエッジケースは、指定されたサブセットの実際のユースケースを制限します。

指示遵守

重み 10%

要求されたサブセットを実装し、コードブロックの言語指定子を無視していますが、トリッキーなインライン入力に対する堅牢性の要件と、正しいリストのネスト/終了は十分に満たされていません。

採点モデル Google Gemini 2.5 Pro

総合点

総評

回答Aは、ヘッダー、段落、コードブロックなどのほとんどのブロックレベル要素を正しく処理する、よく構造化されたステートマシンベースのソリューションを提供します。しかし、シーケンシャルな正規表現置換を使用したインライン要素の解析アプローチは根本的に欠陥があります。この方法は、ネストされたインラインスタイル（例：イタリックを含む太字）を正しく処理できず、これは重大な正しさの問題です。リスト処理ロジックも、代替案と比較して複雑で堅牢性に欠けます。

採点詳細を表示 ▼

正確さ

重み 35%

ソリューションは、ネストされたインラインスタイルを正しく解析できません。たとえば、`**太字 *イタリック* 太字**` は、シーケンシャルな `re.sub` 呼び出しが新しいHTMLタグが含まれる中間文字列に対して操作されるため、誤ってレンダリングされます。これは、解析ロジックにおける重大な正しさの欠陥です。

完全性

重み 20%

ソリューションは、要求されたすべての機能を実装しようとしています。しかし、ネストされたインラインスタイルの実装が不正確であるため、機能的に完全に完了しているとは見なせません。

コード品質

重み 20%

コードは一般的にヘルパー関数や状態変数でよく構造化されています。しかし、シーケンシャルな正規表現置換を解析に選択したのは、この問題に対するアルゴリズム的な選択として不適切であり、その落とし穴に対する理解不足を示しています。リスト処理ロジックもかなり複雑です。

実用性

重み 15%

パーサーが一般的なユースケース（ネストされたインラインスタイル）を正しく処理できないことは、その実用的な価値を著しく制限します。実際のMarkdownドキュメントの変換には信頼性がありません。

指示遵守

重み 10%

100

ソリューションは、関数のシグネチャ、サポートされるMarkdownの特定のサブセット、および出力形式を含む、プロンプトのすべての指示に従っています。

回答B: OpenAI GPT-5.4

def markdown_to_html(markdown_text: str) -> str:
import re
from html import escape

lines = markdown_text.splitlines()
out = []
paragraph_lines = []
list_stack = []
i = 0
in_code_block = False
code_lines = []

def parse_inline(text: str) -> str:
    parts = []
    i = 0
    n = len(text)
    while i < n:
        if text.startswith('***', i):
            j = text.find('***', i + 3)
            if j != -1:
                inner = parse_inline(text[i + 3:j])
                parts.append(f'<strong><em>{inner}</em></strong>')...

全文を表示 ▼

def markdown_to_html(markdown_text: str) -> str:
import re
from html import escape

lines = markdown_text.splitlines()
out = []
paragraph_lines = []
list_stack = []
i = 0
in_code_block = False
code_lines = []

def parse_inline(text: str) -> str:
    parts = []
    i = 0
    n = len(text)
    while i < n:
        if text.startswith('***', i):
            j = text.find('***', i + 3)
            if j != -1:
                inner = parse_inline(text[i + 3:j])
                parts.append(f'<strong><em>{inner}</em></strong>')
                i = j + 3
                continue
        if text.startswith('**', i):
            j = text.find('**', i + 2)
            if j != -1:
                inner = parse_inline(text[i + 2:j])
                parts.append(f'<strong>{inner}</strong>')
                i = j + 2
                continue
        if text.startswith('*', i):
            j = text.find('*', i + 1)
            if j != -1:
                inner = parse_inline(text[i + 1:j])
                parts.append(f'<em>{inner}</em>')
                i = j + 1
                continue
        parts.append(escape(text[i]))
        i += 1
    return ''.join(parts)

def flush_paragraph():
    nonlocal paragraph_lines
    if paragraph_lines:
        text = ' '.join(line.strip() for line in paragraph_lines)
        out.append(f'<p>{parse_inline(text)}</p>')
        paragraph_lines = []

def close_lists_to(level: int):
    while len(list_stack) > level:
        out.append('</li>')
        out.append('</ul>')
        list_stack.pop()

def handle_list_item(indent_spaces: int, content: str):
    level = indent_spaces // 2
    if indent_spaces % 2 != 0:
        return False

    if level > len(list_stack):
        if level != len(list_stack) + 1:
            return False
        out.append('<ul>')
        list_stack.append(True)
    elif level < len(list_stack):
        close_lists_to(level)
        out.append('</li>')
    else:
        if list_stack:
            out.append('</li>')
        else:
            out.append('<ul>')
            list_stack.append(True)

    while len(list_stack) < level + 1:
        out.append('<ul>')
        list_stack.append(True)

    out.append(f'<li>{parse_inline(content)}')
    return True

while i < len(lines):
    line = lines[i]

    if in_code_block:
        if line.startswith('```'):
            out.append(f'<pre><code>{escape("\n".join(code_lines))}</code></pre>')
            code_lines = []
            in_code_block = False
        else:
            code_lines.append(line)
        i += 1
        continue

    if line.startswith('```'):
        flush_paragraph()
        close_lists_to(0)
        in_code_block = True
        code_lines = []
        i += 1
        continue

    if not line.strip():
        flush_paragraph()
        close_lists_to(0)
        i += 1
        continue

    header_match = re.match(r'^(#{1,6})\s+(.*)$', line)
    if header_match:
        flush_paragraph()
        close_lists_to(0)
        level = len(header_match.group(1))
        content = parse_inline(header_match.group(2).strip())
        out.append(f'<h{level}>{content}</h{level}>')
        i += 1
        continue

    list_match = re.match(r'^( *) (- )(.+)$', line)
    if list_match:
        flush_paragraph()
        indent = len(list_match.group(1))
        content = list_match.group(3)
        if handle_list_item(indent, content):
            i += 1
            continue

    if list_stack:
        close_lists_to(0)

    paragraph_lines.append(line)
    i += 1

if in_code_block:
    out.append(f'<pre><code>{escape("\n".join(code_lines))}</code></pre>')

flush_paragraph()
close_lists_to(0)

return '\n'.join(out)

判定

1位 | 勝者

勝利票

3 / 3

平均スコア

採点モデル Anthropic Claude Sonnet 4.6

総合点

総評

回答Bは、ネストされたインライン要素を正しく処理し、閉じられていないマーカーに対してはリテラル文字に優雅にフォールバックする、文字ごとのインラインパーサーを実装しています。これはインライン解析において正規表現よりも堅牢なアプローチです。リスト処理ロジックはよりクリーンで正確です。コードブロック検出は仕様に従いline.startswith('```')を使用しています。handle_list_item関数は、elseブランチでlist_stackが空の場合にのみ<ul>をアペンドしますが、その後のwhileループはレベルがlen(list_stack)より大きい場合を処理するため、わずかに冗長ですが機能的です。インラインパーサーは、マークダウンパターンの一部ではない個々の文字を正しくエスケープし、適切なHTMLエスケープを提供します。全体として、より堅牢で正確な実装です。

採点詳細を表示 ▼

正確さ

重み 35%

回答Bはすべてのブロック要素を正しく処理します。文字ごとのインラインパーサーは、閉じられていないマーカーをリテラル文字として扱うことで正しく処理します。リスト処理は一般的に正しいですが、`handle_list_item`のelseブランチには軽微なロジックの問題があります。コードブロック検出は正しいです。全体として、主要な堅牢性要件においてAよりも正確です。

完全性

重み 20%

すべての必須機能が実装されています：ヘッダー、ネストされた順序なしリスト、コードブロック、段落、および3つのインラインスタイルすべて。この実装は、タスクプロンプトの指定されたすべての機能を網羅しています。

コード品質

重み 20%

コードは関心の分離が明確で、よく整理されています。文字ごとのインラインパーサーはより洗練されており、正確です。`handle_list_item`関数はリストロジックをうまくカプセル化しています。軽微な問題：`handle_list_item`のelseブランチには冗長なロジックがあります。全体的に、よりクリーンで保守性が高いです。

実用性

重み 15%

このソリューションは実用的であり、一般的なケースをうまく処理します。インラインパーサーの閉じられていないマーカーに対する堅牢性は、実際の使用においてより信頼性が高くなります。`__main__`ブロックはありませんが、関数は自己完結型でインポート可能です。

指示遵守

重み 10%

指定されたすべての指示に従っています：正しい関数シグネチャ、すべての必須機能のサポート、指定されたインライン優先順位の処理、サポートされていない機能の実装なし、閉じられていないインラインタグをリテラル文字として扱うことによる明示的な処理。HTMLエスケープは文字ごとに適用されます。

採点モデル OpenAI GPT-5.2

総合点

総評

コードブロック、ヘッダー、リスト、段落に対してより明確なステートマシンを実装し、優先順位（）、次に（）、次に（）を尊重する再帰的なインラインパーサーを使用しています。閉じられていないマーカー（リテラルとして残す）に対しても堅牢です。HTMLエスケープは、通常のテキストでは文字レベルで安全に処理され、コードブロックではhtml.escapeを介して処理されます。リストの処理はAよりも正確に近いですが、まだ不完全です。インデントの飛躍や一部の閉じ/開きシーケンスは疑わしいHTMLを生成する可能性があり、すべてのケースでネストされたが親内に明確に配置されることを保証しません。全体として、Aよりも堅牢で仕様に忠実です。

採点詳細を表示 ▼

正確さ

重み 35%

ヘッダー/段落/コードブロックについては正しいです。インライン強調表示は、適切な優先順位と再帰で解析され、閉じられていないマーカーに対して堅牢です。リストのネストは、すべてのケースでまだ完全には正しいHTMLではありません（ネストされた<ul>が常に開いている<li>の下にあるわけではない、レベル変更のエッジケース）、しかし一般的にはAよりも仕様に近い状態です。

完全性

重み 20%

指定されたすべてのブロックと、再帰によるネストサポートを備えた3つのインラインスタイルすべてをカバーしています。残りのギャップは主にリストHTML構造のエッジケースです。

コード品質

重み 20%

ヘルパー関数と決定論的なインラインパーサーにより、構造化されています。リスト処理は少し複雑ですが、Aよりも一貫性があり、エスケープも一貫して処理されています。

実用性

重み 15%

堅牢なインライン処理とより安全なエスケープにより、実用性が向上しました。残りのリストネストの不完全さは依然として信頼性を制限しますが、Aほどではありません。

指示遵守

重み 10%

優先順位や不正なインライン処理を含むサブセット要件に密接に従っており、コードブロック内のインライン解析を正しく無効にしています。マイナーな逸脱は、主に厳密なリストHTMLネストの詳細にあります。

採点モデル Google Gemini 2.5 Pro

総合点

総評

回答Bは、堅牢で優れたソリューションです。その主な強みはparse_inline関数にあり、これは再帰下降アプローチを使用して、複雑なネストや優先順位のルールを含むインラインスタイルを正しく処理します。これは、回答Aで使用されている正規表現置換よりもはるかに適切で強力な手法です。ブロックレベルの解析も非常に堅牢で、リストのインデントに対するチェックもより堅牢です。唯一の軽微なスタイル上の問題は、インポートを関数内に配置していることですが、これは実装の優れた正しさや品質には影響しません。

採点詳細を表示 ▼

正確さ

重み 35%

このソリューションは非常に正確です。再帰的な`parse_inline`関数は、タスクの難しい部分であるすべてのインラインスタイルの優先順位とネストを正しく処理します。リストのネストを含むブロックレベルの解析も、正しく堅牢に実装されています。

完全性

重み 20%

100

ヘッダー、段落、コードブロック、ネストされたリスト、および正しい優先順位とネストを持つ3つのインラインスタイルバリエーションすべてを含む、指定されたすべての機能が完全に正しく実装されています。

コード品質

重み 20%

コードは整理されており、解析技術に対する深い理解を示しています。インライン解析のための再帰関数の使用は、優れた適切なアルゴリズムの選択です。コードは読みやすく、堅牢です。インポートを関数内に配置するという慣習に反する点について、軽微な減点があります。

実用性

重み 15%

このソリューションは、指定されたMarkdownサブセットに対して使用できるほど堅牢で正確です。その堅牢なアルゴリズム基盤は、より多くの機能をサポートするように確実に拡張できることを意味し、高い実用価値があります。

指示遵守

重み 10%

100

このソリューションは、プロンプトで与えられたすべての指示に完全に準拠しており、正しい署名を持つ必要な関数を実装し、要求された正確な機能セットをサポートしています。

比較結果サマリー

最終順位は、採点者ごとの順位集約（平均順位 + ボルダ方式の同点処理）で決定します。平均点は参考表示です。

採点者数: 3

Anthropic Claude Opus 4.7

勝利票

0 / 3

平均点

この回答を見る

勝者 OpenAI GPT-5.4

勝利票

3 / 3

平均点

この回答を見る

このモデル組み合わせの通算戦績を見る

採点結果

採点モデル Google Gemini 2.5 Pro

Claude Opus 4.7 63

GPT-5.4 勝者 91

勝者理由

回答Bは、特にインラインマークダウン要素の処理において、その優れた正しさともろさから、明確な勝者です。回答Aは逐次的な正規表現置換メソッドを使用しており、ネストされたインラインスタイルでは失敗します。これはパーサーにとって致命的な欠陥です。対照的に、回答Bはインライン要素用の適切な再帰パーサーを実装しており、要求されるネストと優先順位を正しく処理します。さらに、回答Bのリスト処理ロジックはより堅牢で、有効なインデントの明示的なチェックが含まれており、全体としてより高品質で信頼性の高いソリューションとなっています。

採点モデル OpenAI GPT-5.2

Claude Opus 4.7 59

GPT-5.4 勝者 71

勝者理由

回答Bが勝利したのは、より正確で堅牢なインラインパーサー（適切な優先順位、再帰、閉じられていないマーカーの正常な処理）を備え、ブロック解析も全体的によりクリーンであるためです。どちらもリストのネストに関するHTML構造の問題を抱えていますが、Aのリストの閉じ/開きロジックはよりエラーが発生しやすく、正規表現によるインライン処理は、トリッキーなネスト/オーバーラップする強調パターンに対してそれほど堅牢ではないため、Bの方が最も重み付けの高い基準（正確性）および全体として優れています。

採点モデル Anthropic Claude Sonnet 4.6

Claude Opus 4.7 70

GPT-5.4 勝者 75

勝者理由

回答Bは、主に正しさ（correctness）と堅牢性（robustness）において優れています。文字ごとのインラインパーサーは、閉じられていないマーカーを（リテラルテキストとして扱い）正しく処理し、ネストされたインライン要素もサポートしており、これは重要な要件です。回答Aの正規表現ベースのインラインパーサーは、閉じられていないマーカーを意図しない境界をまたいでマッチさせてしまう可能性があり、失敗することがあります。また、回答Bはリストの処理ロジックがよりクリーンで、インラインパーサーにおける文字ごとのHTMLエスケープも適切に行われています。両方の回答ともリスト管理にはいくつかのエッジケースがありますが、回答Bの全体的なアプローチは、特にタスクで明示的に言及されているインラインパーシングの堅牢性基準において、指定された要件に対してより堅牢で正確です。

MarkdownサブセットをHTMLに変換するコンバータ

お題概要

お題本文

回答

回答A: Anthropic Claude Opus 4.7

回答B: OpenAI GPT-5.4

比較結果サマリー

採点結果

関連お題

新しい仕事でのインポスター症候群への対応

コミュニティ公園の再活性化ブレインストーミング

週4日勤務制導入の説得力あるメモ

仕事の不安に対する共感的な返答

架空の研究論文を要約：都市の緑地について

職場での圧倒感への共感的な応答

高校生にトランスフォーマーモデルを説明する

スーパーマーケットの食品ロスに対する創造的な解決策

関連リンク