Exemplo guiado

decathlon.com.br

Este caso mostrou uma dificuldade diferente da Dafiti e da Netshoes. O automático já encontrava bem o card da listagem, mas o campo nome foi contaminado pelo texto de navegação do carrossel dentro do próprio card.

e-commerce difícilcarrossel dentro do cardsemântica de nome

Objetivo

Extrair produtos para Excel

  • nome
  • preco
  • url

URL alvo:

www.decathlon.com.br/esportes/corrida

O que tornou o caso difícil

O nome parecia estar lá, mas não era o nome real

A categoria da Decathlon não caiu em bloqueio, não colapsou para uma linha e nem trouxe preço nulo. Ainda assim, o campo nome saiu errado na primeira rodada automática, porque o card carregava um bloco interno de navegação do carrossel com texto acessível.

Na prática, isso significava uma saída com 24 linhas e estrutura boa, mas com um erro semântico grave: vários produtos vinham com Controles de navegação do carrossel no lugar do nome.

Linha do tempo

Como o caso foi fechado

1. Primeiro erro real

O automático já encontrava card, preço e URL, mas capturava o campo nome como Controles de navegação do carrossel.

2. Diagnóstico correto

O problema não estava em preço nem em URL. O resolvedor de nome estava premiando um bloco de navegação do carrossel dentro do card, em vez do título real do produto.

3. Correção semântica

A descoberta automática de nome passou a penalizar seletores e textos de carrossel, e o avaliador passou a tratar nome repetido em massa como sinal de campo semanticamente errado.

4. Resultado final

A categoria fechou com 24 linhas, nome, preço e URL corretos, sem nulls e sem revisão manual.

Schema final

Campos que fecharam a categoria

Nome do campo: nome

Tipo: string

Descrição: Nome do produto no card da listagem

Hint de seletor: div.product-card-v2.w-full.flex h2.font-inter.font-regular.leading-2

Nome do campo: preco

Tipo: number

Descrição: Preço do produto no card da listagem

Hint de seletor: div.product-card-v2.w-full.flex div.product-card__content--price.flex.gap-2

Nome do campo: url

Tipo: url

Descrição: URL do produto no card da listagem

Hint de seletor: div.product-card-v2.w-full.flex [data-testid="product-link"]

Leitura mental do card

Onde o automático se confundiu no começo

Dentro do mesmo card de produto conviviam:

  • carrossel de imagens
  • texto acessível de navegação do slider
  • título real do produto
  • preço
  • link do produto

O ajuste que resolveu o caso foi fazer o Intelbot desconfiar de termos como carrossel, slide, arrow e navegação quando o campo esperado era nome.

O que este caso ensinou

Regras práticas para o automático

Card correto não basta

Mesmo quando o container repetido está certo, o campo nome ainda pode capturar um rótulo interno do componente em vez do dado comercial.

Qualidade estrutural sozinha é insuficiente

Se o nome se repete quase igual em toda a lista, isso já é sinal de erro semântico, mesmo sem nulls e sem quebra de tipo.

Carrossel dentro do card é armadilha real

Sites modernos embutem controles de slider, textos de acessibilidade e outros rótulos técnicos dentro do mesmo card do produto.

Resultado esperado

Quando considerar a categoria resolvida

  • o modo deve sair como list
  • os nomes devem vir como título real de produto
  • preco e url devem permanecer corretos
  • a planilha Excel deve sair pronta sem revisão manual