Conversor de Subconjunto Markdown para HTML

Compare as respostas dos modelos para esta tarefa de benchmark em Programação e reveja pontuações, comentários e exemplos relacionados.

Entre ou cadastre-se para usar curtidas e favoritos. Cadastrar

X f L

Índice

Visão geral da tarefa

Gêneros de comparação

Programação

Modelo criador da tarefa O criador da tarefa é selecionado aleatoriamente entre os principais modelos de geração de tarefas dos provedores compatíveis.

Google Gemini 2.5 Pro

Modelos participantes Neste benchmark, os modelos do mesmo provedor que o criador da tarefa são excluídos da resposta.

Resposta A Anthropic Claude Opus 4.7

Resposta B OpenAI GPT-5.4

Modelos avaliadores A avaliação usa exatamente 3 modelos avaliadores, excluindo os modelos respondentes. Pelo menos 1 avaliador é selecionado entre modelos de nível superior, modelos leves não são usados como avaliadores, e os 3 avaliadores vêm de 3 provedores distintos.

OpenAI GPT-5.2 Anthropic Claude Sonnet 4.6 Google Gemini 2.5 Pro

Enunciado da tarefa

Escreva uma função Python markdown_to_html(markdown_text: str) -> str que converta uma string contendo um subconjunto específico de Markdown em sua correspondente representação HTML.

A função deve suportar os seguintes recursos:

Elementos de Bloco:

Cabeçalhos: Linhas que começam com # até ###### devem ser convertidas para as tags <h1> até <h6>.
Listas Não Ordenadas: Linhas que começam com - devem ser convertidas em <ul> e <li> tags. Listas aninhadas, indentadas por dois espa...

Mostrar mais ▼

Escreva uma função Python markdown_to_html(markdown_text: str) -> str que converta uma string contendo um subconjunto específico de Markdown em sua correspondente representação HTML.

A função deve suportar os seguintes recursos:

Elementos de Bloco:

Cabeçalhos: Linhas que começam com # até ###### devem ser convertidas para as tags <h1> até <h6>.
Listas Não Ordenadas: Linhas que começam com - devem ser convertidas em <ul> e <li> tags. Listas aninhadas, indentadas por dois espaços por nível, devem ser suportadas. Uma lista é terminada por uma linha em branco ou por um elemento de bloco diferente.
Blocos de Código: Conteúdo entre linhas com três crases () deve ser convertido em `<pre><code>...</code></pre>`. O especificador de linguagem nas crases de abertura (por exemplo, python) deve ser ignorado. Nenhum outro processamento de Markdown deve ocorrer dentro de um bloco de código.
Parágrafos: Qualquer outro texto deve ser envolvido em tags <p>. Linhas consecutivas de texto pertencem ao mesmo parágrafo. Parágrafos são separados por uma ou mais linhas em branco.

Elementos Inline:

Negrito e Itálico: ***text*** deve ser convertido em <strong><em>text</em></strong>.
Negrito: **text** deve ser convertido em <strong>text</strong>.
Itálico: *text* deve ser convertido em <em>text</em>.

Regras e Restrições:

Elementos inline podem ser aninhados dentro de cabeçalhos e itens de lista.
O parser deve ser robusto a entradas malformadas ou complicadas, como tags inline não fechadas. Por exemplo, *italic deve ser renderizado como <p>*italic</p>.
A ordem de precedência para elementos inline é ***, depois **, depois *.
Assuma que a entrada é uma única string multilinha.
Não implemente suporte para quaisquer outros recursos do Markdown, como links, imagens, blockquotes ou listas ordenadas.
O HTML de saída não precisa ser um documento completo (não são necessárias tags <html> ou <body>).

Exemplo de Entrada:

# Header 1

This is a paragraph with **bold** and *italic* text.
This is the same paragraph.

- List item one
- List item two with ***bold and italic***
  - Nested list item
- Back to the first level

```python
def hello():
    print("Hello, World!")

Informação complementar

Esta tarefa testa a habilidade de escrever um parser para uma linguagem simples e bem definida. Exige um tratamento cuidadoso de diferentes estados (por exemplo, dentro de uma lista, dentro de um bloco de código), o parsing tanto de elementos de nível de bloco quanto de nível inline, e o gerenciamento de estruturas aninhadas. Uma solução bem-sucedida demonstrará bom desenho de algoritmo, atenção a casos de borda e uma estrutura de código robusta.

Política de avaliação

Uma resposta de alta qualidade implementará corretamente todos os recursos especificados. A solução deve ser robusta e lidar graciosamente com casos de borda, como listas aninhadas, formatação inline aninhada e sintaxe malformada. O código deve ser bem estruturado, legível e eficiente.

Correção: O HTML gerado deve refletir com precisão a entrada em Markdown de acordo com todas as regras. Preste muita atenção ao aninhamento correto de listas e estilos inline.
Robustez: O código não deve falhar com entra...

Mostrar mais ▼

Correção: O HTML gerado deve refletir com precisão a entrada em Markdown de acordo com todas as regras. Preste muita atenção ao aninhamento correto de listas e estilos inline.
Robustez: O código não deve falhar com entradas complicadas ou malformadas. Por exemplo, um * não fechado deve ser tratado como um caractere literal.
Qualidade do Código: A solução deve ser bem organizada e fácil de entender. Usar expressões regulares é uma abordagem válida, assim como uma máquina de estados ou outras técnicas de parsing. A escolha do algoritmo e a qualidade de sua implementação serão avaliadas.
Completude: Todos os recursos especificados (cabeçalhos, parágrafos, listas com aninhamento, blocos de código e os três estilos inline) devem ser implementados.

Respostas

Resposta A: Anthropic Claude Opus 4.7

import re
import html

def markdown_to_html(markdown_text: str) -> str:
"""Converte um subconjunto de Markdown para HTML.

Recursos suportados:
  - Cabeçalhos (# .. ######)
  - Listas não ordenadas com aninhamento de 2 espaços
  - Blocos de código delimitados (```)
  - Parágrafos
  - Inline: ***negrito+itálico***, **negrito**, *itálico*
"""

def escape(text: str) -> str:
    # Escapa caracteres sensíveis a HTML.
    return html.escape(text, quote=False)

def process_inline(text: str) -> str:
    """Processa markdown inline. Funciona em texto já escapado, pois...

Mostrar resposta completa ▼

import re
import html

def markdown_to_html(markdown_text: str) -> str:
"""Converte um subconjunto de Markdown para HTML.

Recursos suportados:
  - Cabeçalhos (# .. ######)
  - Listas não ordenadas com aninhamento de 2 espaços
  - Blocos de código delimitados (```)
  - Parágrafos
  - Inline: ***negrito+itálico***, **negrito**, *itálico*
"""

def escape(text: str) -> str:
    # Escapa caracteres sensíveis a HTML.
    return html.escape(text, quote=False)

def process_inline(text: str) -> str:
    """Processa markdown inline. Funciona em texto já escapado, pois
    os marcadores *, ** e *** não contêm caracteres escapados."""
    escaped = escape(text)

    # Ordem de precedência: ***, depois **, depois *.
    # Usa correspondência não gulosa e exige limites de não espaço em branco de forma flexível.
    # ***texto***
    escaped = re.sub(
        r'\*\*\*(.+?)\*\*\*',
        r'<strong><em>\1</em></strong>',
        escaped,
    )
    # **texto**
    escaped = re.sub(
        r'\*\*(.+?)\*\*',
        r'<strong>\1</strong>',
        escaped,
    )
    # *texto*
    escaped = re.sub(
        r'\*(.+?)\*',
        r'<em>\1</em>',
        escaped,
    )
    return escaped

lines = markdown_text.split('\n')
output = []

# Rastreadores de estado
in_code_block = False
code_buffer = []

paragraph_buffer = []

# Pilha de lista: lista de níveis de indentação (0, 1, 2, ...) atualmente abertos
list_stack = []

def flush_paragraph():
    if paragraph_buffer:
        content = ' '.join(paragraph_buffer)
        output.append(f'<p>{process_inline(content)}</p>')
        paragraph_buffer.clear()

def close_lists_to(level):
    """Fecha listas até que restem apenas `level` listas abertas (level = número de <ul> abertos)."""
    while len(list_stack) > level:
        output.append('</li>')
        output.append('</ul>')
        list_stack.pop()
        if list_stack:
            # Após fechar uma lista aninhada, o <li> pai permanece aberto;
            # nós o fechamos quando o próximo irmão começa ou quando fechamos completamente.
            pass

def close_all_lists():
    while list_stack:
        output.append('</li>')
        output.append('</ul>')
        list_stack.pop()

i = 0
while i < len(lines):
    line = lines[i]

    # Tratamento de bloco de código
    if in_code_block:
        if line.strip().startswith('```'):
            # Fim do bloco de código
            code_content = '\n'.join(code_buffer)
            output.append(f'<pre><code>{escape(code_content)}</code></pre>')
            code_buffer = []
            in_code_block = False
        else:
            code_buffer.append(line)
        i += 1
        continue

    # Verifica o início do bloco de código
    stripped = line.strip()
    if stripped.startswith('```'):
        flush_paragraph()
        close_all_lists()
        in_code_block = True
        i += 1
        continue

    # Linha em branco
    if stripped == '':
        flush_paragraph()
        close_all_lists()
        i += 1
        continue

    # Cabeçalho?
    header_match = re.match(r'^(#{1,6}) +(.*)$', line)
    if header_match:
        flush_paragraph()
        close_all_lists()
        level = len(header_match.group(1))
        content = header_match.group(2).rstrip()
        output.append(f'<h{level}>{process_inline(content)}</h{level}>')
        i += 1
        continue

    # Item de lista?
    # Corresponde a espaços iniciais (devem ser pares para aninhamento) seguidos por '- '
    list_match = re.match(r'^( *)- +(.*)$', line)
    if list_match:
        flush_paragraph()
        indent_spaces = len(list_match.group(1))
        # Trata como um nível de aninhamento válido apenas se a indentação for um múltiplo de 2
        indent_level = indent_spaces // 2
        content = list_match.group(2)

        # Ajusta a pilha de listas
        if not list_stack:
            # Começando do zero: a primeira lista deve estar no nível 0
            indent_level = 0
            output.append('<ul>')
            list_stack.append(0)
            output.append(f'<li>{process_inline(content)}')
        else:
            current_depth = len(list_stack) - 1  # índice superior
            if indent_level > current_depth:
                # Abre uma nova lista aninhada (avança apenas um nível de cada vez)
                indent_level = current_depth + 1
                output.append('<ul>')
                list_stack.append(indent_level)
                output.append(f'<li>{process_inline(content)}')
            elif indent_level == current_depth:
                # Irmão no mesmo nível: fecha o <li> anterior
                output.append('</li>')
                output.append(f'<li>{process_inline(content)}')
            else:
                # Recua: fecha listas mais profundas
                while len(list_stack) - 1 > indent_level:
                    output.append('</li>')
                    output.append('</ul>')
                    list_stack.pop()
                    # Fecha também o <li> pai que continha esta lista aninhada
                    output.append('</li>')
                # Agora no mesmo nível: adiciona o irmão
                output.append(f'<li>{process_inline(content)}')
        i += 1
        continue

    # Caso contrário, é uma linha de parágrafo
    if list_stack:
        close_all_lists()
    paragraph_buffer.append(line.strip())
    i += 1

# Fim da entrada: descarrega tudo
if in_code_block:
    # Bloco de código não fechado: emite o que tivermos
    code_content = '\n'.join(code_buffer)
    output.append(f'<pre><code>{escape(code_content)}</code></pre>')
flush_paragraph()
close_all_lists()

return '\n'.join(output)

if name == 'main':
sample = '''# Cabeçalho 1

Este é um parágrafo com texto negrito e itálico.
Este é o mesmo parágrafo.

Item de lista um
Item de lista dois com negrito e itálico
- Item de lista aninhada
De volta ao primeiro nível

def hello():
    print("Hello, World!")

'''
print(markdown_to_html(sample))

Resultado

Votos de vitória

0 / 3

Pontuação média

Modelos avaliadores Anthropic Claude Sonnet 4.6

Pontuação total

Comentário geral

A Resposta A implementa todas as funcionalidades exigidas e está bem estruturada com comentários claros. O analisador inline usa substituições de regex em ordem de precedência, o que funciona na maioria dos casos, mas tem uma falha sutil: ele não escapa caracteres HTML antes de aplicar padrões inline, e o escape é aplicado primeiro, o que pode interferir nos padrões. Mais criticamente, a lógica de fechamento de listas tem um bug ao recuar: ele emite um </li> extra para o item pai antes de reabrir no mesmo nível, o que pode produzir HTML malformado. A detecção de blocos de código usa line.strip().startswith('```'), que é um pouco mais permissiva do que o necessário. No geral, é uma tentativa sólida com alguns problemas de casos extremos no tratamento de listas.

Ver detalhes da avaliação ▼

Correção

Peso 35%

A Resposta A lida corretamente com cabeçalhos, parágrafos, blocos de código e formatação inline básica. No entanto, a lógica de recuo de listas tem um bug: ao fechar listas aninhadas, ela emite um `</li>` extra para o item pai, o que pode produzir HTML malformado. A abordagem de regex inline também pode corresponder a limites não intencionais para marcadores não fechados como `*itálico`, potencialmente correspondendo a um `*` posterior no texto.

Completude

Peso 20%

Todas as funcionalidades exigidas são implementadas: cabeçalhos (h1-h6), listas não ordenadas com aninhamento, blocos de código com especificador de idioma ignorado, parágrafos e todos os três estilos inline (negrito+itálico, negrito, itálico). A amostra principal da tarefa é tratada.

Qualidade do código

Peso 20%

O código está bem organizado com funções auxiliares claras e bons comentários. A docstring é útil. No entanto, a lógica de gerenciamento de listas é um tanto complexa e tem bugs sutis. A abordagem de regex para análise inline é mais simples, mas menos robusta. A função `close_lists_to` é definida, mas não usada no loop principal (apenas `close_all_lists` é usada).

Valor prático

Peso 15%

A solução funciona para casos comuns e inclui um bloco `__main__` executável com a entrada de exemplo, o que é útil para testes. No entanto, os bugs de aninhamento de listas e os possíveis problemas de regex inline reduzem a confiabilidade prática para casos extremos.

Seguimento de instruções

Peso 10%

Segue todas as instruções especificadas: assinatura de função correta, suporta todas as funcionalidades exigidas, lida com a ordem de precedência inline especificada, não implementa funcionalidades não suportadas e lida com tags não fechadas (embora imperfeitamente com regex). O escape HTML é aplicado.

Modelos avaliadores OpenAI GPT-5.2

Pontuação total

Comentário geral

Implementa os tipos de bloco e a formatação inline exigidos com uma máquina de estados simples e substituições inline baseadas em regex, e escapa corretamente o HTML, inclusive dentro de blocos de código. No entanto, a geração de listas tem múltiplos problemas estruturais: emite sequências de e que podem levar a aninhamento inválido, lida mal com recuos ( extras) e pode abrir aninhados sem estar dentro de um pai. O tratamento inline via regex não é robusto para casos complicados/malformados (por exemplo, marcadores sobrepostos como negrito itálico) e não suporta aninhamento recursivo de elementos inline conforme exigido/esperado.

Ver detalhes da avaliação ▼

Correção

Peso 35%

Correto para cabeçalhos/parágrafos/blocos de código básicos e ênfase simples, mas o aninhamento/fechamento de listas é frequentemente inválido (</li> extras, problemas de posicionamento de <ul> aninhados) e a ênfase por regex pode lidar mal com casos sobrepostos/aninhados (por exemplo, **negrito *itálico***).

Completude

Peso 20%

Cobre todas as categorias de recursos solicitadas, mas o suporte ao aninhamento de listas é não confiável e o aninhamento inline não é verdadeiramente suportado além de padrões simples, reduzindo a completude efetiva.

Qualidade do código

Peso 20%

Legível e modular, mas a lógica da pilha de listas é complicada com um auxiliar não utilizado/ineficaz (close_lists_to) e transições de estado frágeis; substituições pesadas de regex reduzem a clareza/robustez.

Valor prático

Peso 15%

Útil para entradas simples, mas o HTML de lista inválido e os casos extremos de ênfase limitam a usabilidade no mundo real para o subconjunto declarado.

Seguimento de instruções

Peso 10%

Implementa o subconjunto solicitado e ignora o especificador de idioma do bloco de código; no entanto, o requisito de robustez para entradas inline complicadas e aninhamento/terminação correta de listas não é bem atendido.

Modelos avaliadores Google Gemini 2.5 Pro

Pontuação total

Comentário geral

A Resposta A apresenta uma solução bem estruturada, baseada em máquina de estados, que lida corretamente com a maioria dos elementos de nível de bloco, como cabeçalhos, parágrafos e blocos de código. No entanto, sua abordagem para analisar elementos inline usando substituições sequenciais de expressões regulares é fundamentalmente falha. Este método não lida corretamente com estilos inline aninhados (por exemplo, negrito contendo itálico), o que é uma questão significativa de correção. A lógica de tratamento de listas também é complexa e menos robusta que a alternativa.

Ver detalhes da avaliação ▼

Correção

Peso 35%

A solução não consegue analisar corretamente estilos inline aninhados. Por exemplo, `**negrito *itálico* negrito**` é renderizado incorretamente porque as chamadas sequenciais `re.sub` operam na string intermediária contendo tags HTML recém-adicionadas. Esta é uma falha significativa de correção na lógica de análise.

Completude

Peso 20%

A solução tenta implementar todos os recursos necessários. No entanto, como a implementação de estilos inline aninhados está incorreta, ela não pode ser considerada totalmente completa em sua funcionalidade.

Qualidade do código

Peso 20%

O código é geralmente bem estruturado com funções auxiliares e variáveis de estado. No entanto, a escolha de uma substituição sequencial de regex para análise é uma escolha algorítmica ruim para este problema, demonstrando falta de compreensão de suas armadilhas. A lógica de tratamento de listas também é bastante complicada.

Valor prático

Peso 15%

O tratamento incorreto do analisador para um caso de uso comum (estilos inline aninhados) limita severamente seu valor prático. Não seria confiável para converter documentos de markdown do mundo real.

Seguimento de instruções

Peso 10%

100

A solução adere a todas as instruções do prompt, incluindo a assinatura da função, o subconjunto específico de Markdown a ser suportado e o formato de saída.

Resposta B: OpenAI GPT-5.4

def markdown_to_html(markdown_text: str) -> str:
import re
from html import escape

lines = markdown_text.splitlines()
out = []
paragraph_lines = []
list_stack = []
i = 0
in_code_block = False
code_lines = []

def parse_inline(text: str) -> str:
    parts = []
    i = 0
    n = len(text)
    while i < n:
        if text.startswith('***', i):
            j = text.find('***', i + 3)
            if j != -1:
                inner = parse_inline(text[i + 3:j])
                parts.append(f'<strong><em>{inner}</em></strong>')...

Mostrar resposta completa ▼

def markdown_to_html(markdown_text: str) -> str:
import re
from html import escape

lines = markdown_text.splitlines()
out = []
paragraph_lines = []
list_stack = []
i = 0
in_code_block = False
code_lines = []

def parse_inline(text: str) -> str:
    parts = []
    i = 0
    n = len(text)
    while i < n:
        if text.startswith('***', i):
            j = text.find('***', i + 3)
            if j != -1:
                inner = parse_inline(text[i + 3:j])
                parts.append(f'<strong><em>{inner}</em></strong>')
                i = j + 3
                continue
        if text.startswith('**', i):
            j = text.find('**', i + 2)
            if j != -1:
                inner = parse_inline(text[i + 2:j])
                parts.append(f'<strong>{inner}</strong>')
                i = j + 2
                continue
        if text.startswith('*', i):
            j = text.find('*', i + 1)
            if j != -1:
                inner = parse_inline(text[i + 1:j])
                parts.append(f'<em>{inner}</em>')
                i = j + 1
                continue
        parts.append(escape(text[i]))
        i += 1
    return ''.join(parts)

def flush_paragraph():
    nonlocal paragraph_lines
    if paragraph_lines:
        text = ' '.join(line.strip() for line in paragraph_lines)
        out.append(f'<p>{parse_inline(text)}</p>')
        paragraph_lines = []

def close_lists_to(level: int):
    while len(list_stack) > level:
        out.append('</li>')
        out.append('</ul>')
        list_stack.pop()

def handle_list_item(indent_spaces: int, content: str):
    level = indent_spaces // 2
    if indent_spaces % 2 != 0:
        return False

    if level > len(list_stack):
        if level != len(list_stack) + 1:
            return False
        out.append('<ul>')
        list_stack.append(True)
    elif level < len(list_stack):
        close_lists_to(level)
        out.append('</li>')
    else:
        if list_stack:
            out.append('</li>')
        else:
            out.append('<ul>')
            list_stack.append(True)

    while len(list_stack) < level + 1:
        out.append('<ul>')
        list_stack.append(True)

    out.append(f'<li>{parse_inline(content)}')
    return True

while i < len(lines):
    line = lines[i]

    if in_code_block:
        if line.startswith('```'):
            out.append(f'<pre><code>{escape("\n".join(code_lines))}</code></pre>')
            code_lines = []
            in_code_block = False
        else:
            code_lines.append(line)
        i += 1
        continue

    if line.startswith('```'):
        flush_paragraph()
        close_lists_to(0)
        in_code_block = True
        code_lines = []
        i += 1
        continue

    if not line.strip():
        flush_paragraph()
        close_lists_to(0)
        i += 1
        continue

    header_match = re.match(r'^(#{1,6})\s+(.*)$', line)
    if header_match:
        flush_paragraph()
        close_lists_to(0)
        level = len(header_match.group(1))
        content = parse_inline(header_match.group(2).strip())
        out.append(f'<h{level}>{content}</h{level}>')
        i += 1
        continue

    list_match = re.match(r'^( *)(- )(.+)$', line)
    if list_match:
        flush_paragraph()
        indent = len(list_match.group(1))
        content = list_match.group(3)
        if handle_list_item(indent, content):
            i += 1
            continue

    if list_stack:
        close_lists_to(0)

    paragraph_lines.append(line)
    i += 1

if in_code_block:
    out.append(f'<pre><code>{escape("\n".join(code_lines))}</code></pre>')

flush_paragraph()
close_lists_to(0)

return '\n'.join(out)

Resultado

#1 | Vencedor

Votos de vitória

3 / 3

Pontuação média

Modelos avaliadores Anthropic Claude Sonnet 4.6

Pontuação total

Comentário geral

A Resposta B implementa um analisador inline caractere por caractere que lida corretamente com elementos inline aninhados e recorre graciosamente a caracteres literais para marcadores não fechados. Esta é uma abordagem mais robusta do que regex para análise inline. A lógica de tratamento de listas é mais limpa e correta. A deteção de blocos de código usa line.startswith('```') que está correto de acordo com a especificação. A função handle_list_item tem um problema de lógica no ramo else, onde anexa <ul> apenas quando list_stack está vazio, mas o loop while seguinte lida com o caso em que level > len(list_stack), tornando-o ligeiramente redundante, mas funcional. O analisador inline escapa corretamente caracteres individuais que não fazem parte de padrões markdown, fornecendo escapamento HTML adequado. No geral, esta é uma implementação mais robusta e correta.

Ver detalhes da avaliação ▼

Correção

Peso 35%

A Resposta B lida corretamente com todos os elementos de bloco. O analisador inline caractere por caractere lida corretamente com marcadores não fechados recorrendo a caracteres literais. O tratamento de listas é geralmente correto, embora o ramo else da função `handle_list_item` tenha um problema de lógica menor. A deteção de blocos de código está correta. No geral, mais correto que A nos requisitos chave de robustez.

Completude

Peso 20%

Todas as funcionalidades exigidas estão implementadas: cabeçalhos, listas não ordenadas com aninhamento, blocos de código, parágrafos e todos os três estilos inline. A implementação abrange todas as funcionalidades especificadas no prompt da tarefa.

Qualidade do código

Peso 20%

O código está bem organizado com clara separação de responsabilidades. O analisador inline caractere por caractere é mais sofisticado e correto. A função `handle_list_item` encapsula bem a lógica de lista. Problema menor: o ramo else na função `handle_list_item` tem lógica redundante. No geral, mais limpo e mais fácil de manter.

Valor prático

Peso 15%

A solução é prática e lida bem com os casos comuns. A robustez do analisador inline para marcadores não fechados torna-o mais confiável em uso no mundo real. Não há bloco `__main__`, mas a função é autocontida e importável.

Seguimento de instruções

Peso 10%

Segue todas as instruções especificadas: assinatura de função correta, suporta todas as funcionalidades exigidas, lida com a ordem de precedência inline especificada, não implementa funcionalidades não suportadas e lida explicitamente com tags inline não fechadas tratando-as como caracteres literais. O escapamento HTML é aplicado por caractere.

Modelos avaliadores OpenAI GPT-5.2

Pontuação total

Comentário geral

Implementa uma máquina de estados mais clara para blocos de código, cabeçalhos, listas e parágrafos, e usa um analisador inline recursivo que respeita a precedência () então () então () enquanto permanece robusto em marcadores não fechados (deixados como literais). A codificação HTML é tratada com segurança a nível de caractere para texto normal e via html.escape para blocos de código. O tratamento de listas está mais próximo do correto do que A, mas ainda imperfeito: saltos de indentação e algumas sequências de fechar/abrir podem gerar HTML questionável, e não garante claramente que aninhado apareça dentro de um pai em todos os casos. No geral, é mais robusto e fiel à especificação do que A.

Ver detalhes da avaliação ▼

Correção

Peso 35%

Correto para cabeçalhos/parágrafos/blocos de código; a ênfase inline é analisada com a precedência e recursão adequadas e é robusta a marcadores não fechados. O aninhamento de listas ainda não é HTML totalmente correto em todos os casos (<ul> aninhado nem sempre sob um <li> aberto, casos extremos com mudanças de nível), mas geralmente mais próximo da especificação do que A.

Completude

Peso 20%

Cobre todos os blocos especificados e todos os três estilos inline com suporte a aninhamento via recursão; a lacuna restante são principalmente casos extremos de estrutura HTML de listas.

Qualidade do código

Peso 20%

Bem estruturado com funções auxiliares e um analisador inline determinístico; o tratamento de listas é um pouco complexo, mas mais coerente do que A, e a codificação é tratada de forma consistente.

Valor prático

Peso 15%

Mais utilizável na prática graças ao tratamento inline robusto e à codificação mais segura; as imperfeições restantes no aninhamento de listas ainda limitam a confiabilidade, mas menos do que A.

Seguimento de instruções

Peso 10%

Segue de perto os requisitos do subconjunto, incluindo precedência e tratamento de inline malformado, e desabilita corretamente a análise inline dentro de blocos de código; desvios menores são principalmente em detalhes de aninhamento HTML de listas estritas.

Modelos avaliadores Google Gemini 2.5 Pro

Pontuação total

Comentário geral

A Resposta B é uma solução excelente e robusta. Seu principal ponto forte reside na função parse_inline, que utiliza uma abordagem de descida recursiva para lidar corretamente com estilos inline, incluindo aninhamento complexo e regras de precedência. Esta é uma técnica muito mais apropriada e poderosa do que a substituição de regex usada pela Resposta A. A análise de blocos também é muito sólida, com verificações mais robustas para a indentação de listas. A única questão estilística menor é a colocação de importações dentro da função, mas isso não afeta a correção e qualidade superiores da implementação.

Ver detalhes da avaliação ▼

Correção

Peso 35%

A solução é altamente correta. A função recursiva `parse_inline` lida corretamente com a precedência e o aninhamento de todos os estilos inline, que é uma parte difícil da tarefa. A análise de blocos, incluindo o aninhamento de listas, também é implementada de forma correta e robusta.

Completude

Peso 20%

100

Todos os recursos especificados, incluindo cabeçalhos, parágrafos, blocos de código, listas aninhadas e todas as três variações de estilo inline com precedência e aninhamento corretos, são implementados de forma completa e correta.

Qualidade do código

Peso 20%

O código está bem organizado e demonstra um forte entendimento de técnicas de análise. O uso de uma função recursiva para análise inline é uma escolha algorítmica excelente e apropriada. O código é legível e robusto. Uma pequena dedução é feita pela colocação não convencional de importações dentro da função.

Valor prático

Peso 15%

Esta solução é robusta e correta o suficiente para ser usada para o subconjunto especificado de Markdown. Sua base algorítmica sólida significa que ela pode ser estendida de forma confiável para suportar mais recursos, conferindo-lhe alto valor prático.

Seguimento de instruções

Peso 10%

100

A solução segue perfeitamente todas as instruções dadas no prompt, implementando a função necessária com a assinatura correta e suportando o conjunto exato de recursos solicitados.

Resumo comparativo

Para cada tarefa e discussão, a classificação final é definida por agregação de rankings por avaliador (rank médio + desempate por Borda). A pontuação média é exibida como referência.

Avaliadores: 3

Anthropic Claude Opus 4.7

Votos de vitória

0 / 3

Pontuação média

Ver esta resposta

Vencedor OpenAI GPT-5.4

Votos de vitória

3 / 3

Pontuação média

Ver esta resposta

Ver histórico total desta dupla de modelos

Resultados da avaliação

Modelos avaliadores Google Gemini 2.5 Pro

Claude Opus 4.7 63

GPT-5.4 Vencedor 91

Motivo do vencedor

A Resposta B é a vencedora clara devido à sua correção e robustez superiores, particularmente no tratamento de elementos de markdown inline. A Resposta A usa um método de substituição de regex sequencial que falha em estilos inline aninhados, uma falha crítica para um parser. Em contraste, a Resposta B implementa um parser recursivo adequado para elementos inline, que lida corretamente com aninhamento e precedência conforme necessário. Além disso, a lógica de tratamento de listas da Resposta B é mais robusta, com verificações explícitas de indentação válida, tornando-a uma solução geral de maior qualidade e mais confiável.

Modelos avaliadores OpenAI GPT-5.2

Claude Opus 4.7 59

GPT-5.4 Vencedor 71

Motivo do vencedor

A resposta B vence porque fornece um analisador inline mais correto e robusto (precedência adequada, recursão e tratamento gracioso de marcadores não fechados) e uma análise de blocos geralmente mais limpa. Embora ambos tenham problemas de estrutura HTML de aninhamento de listas, a lógica de fechamento/abertura de listas de A é mais propensa a erros e seu processamento inline de regex é menos robusto para padrões de ênfase aninhados/sobrepostos complicados, tornando B melhor no critério mais pesado (correção) e no geral.

Modelos avaliadores Anthropic Claude Sonnet 4.6

Claude Opus 4.7 70

GPT-5.4 Vencedor 75

Motivo do vencedor

A Resposta B vence principalmente pela correção e robustez. Seu analisador inline caractere por caractere lida corretamente com marcadores não fechados (tratando-os como texto literal) e suporta elementos inline aninhados, que é um requisito fundamental. O analisador inline baseado em regex da Resposta A pode falhar em marcadores não fechados ao corresponder em limites não intencionais. A Resposta B também tem uma lógica de tratamento de listas mais limpa e um escape HTML adequado por caractere no analisador inline. Embora ambas as respostas tenham alguns casos extremos no gerenciamento de listas, a abordagem geral da Resposta B é mais robusta e correta para os requisitos especificados, particularmente para o critério de robustez da análise inline que é explicitamente mencionado na tarefa.

Conversor de Subconjunto Markdown para HTML

Visão geral da tarefa

Enunciado da tarefa

Respostas

Resposta A: Anthropic Claude Opus 4.7

Resposta B: OpenAI GPT-5.4

Resumo comparativo

Resultados da avaliação

Tarefas relacionadas

Respondendo à síndrome do impostor em um novo emprego

Tempestade de ideias para revitalização do parque comunitário

Memorando Persuasivo para uma Semana de Trabalho de Quatro Dias

Resposta empática à ansiedade relacionada com o trabalho

Resumir um Artigo de Pesquisa Ficcional sobre Espaços Verdes Urbanos

Resposta empática à sobrecarga no trabalho

Explique um Modelo Transformer para um Adolescente

Soluções Criativas para o Desperdício Alimentar em Supermercados

Links relacionados