O automático já encontrava card, preço e URL, mas capturava o campo nome como Controles de navegação do carrossel.
Exemplo guiado
decathlon.com.br
Este caso mostrou uma dificuldade diferente da Dafiti e da Netshoes. O automático já encontrava bem o card da listagem, mas o campo nome foi contaminado pelo texto de navegação do carrossel dentro do próprio card.
Objetivo
Extrair produtos para Excel
- nome
- preco
- url
URL alvo:
www.decathlon.com.br/esportes/corrida
O que tornou o caso difícil
O nome parecia estar lá, mas não era o nome real
A categoria da Decathlon não caiu em bloqueio, não colapsou para uma linha e nem trouxe preço nulo. Ainda assim, o campo nome saiu errado na primeira rodada automática, porque o card carregava um bloco interno de navegação do carrossel com texto acessível.
Na prática, isso significava uma saída com 24 linhas e estrutura boa, mas com um erro semântico grave: vários produtos vinham com Controles de navegação do carrossel no lugar do nome.
Linha do tempo
Como o caso foi fechado
O problema não estava em preço nem em URL. O resolvedor de nome estava premiando um bloco de navegação do carrossel dentro do card, em vez do título real do produto.
A descoberta automática de nome passou a penalizar seletores e textos de carrossel, e o avaliador passou a tratar nome repetido em massa como sinal de campo semanticamente errado.
A categoria fechou com 24 linhas, nome, preço e URL corretos, sem nulls e sem revisão manual.
Schema final
Campos que fecharam a categoria
Nome do campo: nome
Tipo: string
Descrição: Nome do produto no card da listagem
Hint de seletor: div.product-card-v2.w-full.flex h2.font-inter.font-regular.leading-2
Nome do campo: preco
Tipo: number
Descrição: Preço do produto no card da listagem
Hint de seletor: div.product-card-v2.w-full.flex div.product-card__content--price.flex.gap-2
Nome do campo: url
Tipo: url
Descrição: URL do produto no card da listagem
Hint de seletor: div.product-card-v2.w-full.flex [data-testid="product-link"]
Leitura mental do card
Onde o automático se confundiu no começo
Dentro do mesmo card de produto conviviam:
- carrossel de imagens
- texto acessível de navegação do slider
- título real do produto
- preço
- link do produto
O ajuste que resolveu o caso foi fazer o Intelbot desconfiar de termos como carrossel, slide, arrow e navegação quando o campo esperado era nome.
O que este caso ensinou
Regras práticas para o automático
Mesmo quando o container repetido está certo, o campo nome ainda pode capturar um rótulo interno do componente em vez do dado comercial.
Se o nome se repete quase igual em toda a lista, isso já é sinal de erro semântico, mesmo sem nulls e sem quebra de tipo.
Sites modernos embutem controles de slider, textos de acessibilidade e outros rótulos técnicos dentro do mesmo card do produto.
Resultado esperado
Quando considerar a categoria resolvida
- o modo deve sair como
list - os nomes devem vir como título real de produto
- preco e url devem permanecer corretos
- a planilha Excel deve sair pronta sem revisão manual