Exemplo guiado

netshoes.com.br

Este é um caso difícil de e-commerce em que o card visível não basta. O automático acertou nome e URL cedo, mas o preço exigiu leitura híbrida: seletor do card mais dado estruturado escondido no runtime da própria página.

e-commerce difícilpreço ocultomodo automático com IA

Objetivo

Extrair produtos para Excel

  • nome
  • preco
  • url

URL alvo:

www.netshoes.com.br/tenis/masculino

O que tornou o caso difícil

O card misturava dois problemas diferentes

Parte dos cards trazia preço composto no texto, com preço cheio, Pix e parcelamento no mesmo bloco. Outra parte mostrava apenas Confira, sem preço numérico útil no HTML visível.

Por isso, resolver só selectorHint não bastava. Foi necessário melhorar a coerção de número e depois complementar a listagem com o catálogo estruturado já presente na própria página.

Linha do tempo

Como o caso foi fechado

1. Primeira leitura automática

O automático já encontrou o card, nome e URL sem ajuda manual. O problema ficou concentrado no campo preco.

2. Coerção numérica reforçada

A Netshoes mistura preço cheio, preço Pix e parcelamento no mesmo texto. O parser passou a escolher o valor monetário mais relevante do bloco.

3. Leitura de preço oculto

Vários cards mostravam só Confira no HTML visível. O preço real foi recuperado do dado estruturado exposto no runtime da página, como window.__INITIAL_STATE__, dataLayer e JSON-LD.

Schema final

Campos que fecharam o caso

Nome do campo: nome

Tipo: string

Descrição: Nome do produto no card da listagem

Hint de seletor: div.card.double-columns.full-image span.card__description--name

Nome do campo: preco

Tipo: number

Descrição: Preço final do produto na listagem

Hint de seletor: div.card.double-columns.full-image div.card__description--price

Nome do campo: url

Tipo: url

Descrição: URL do produto no card da listagem

Hint de seletor: div.card.double-columns.full-image a.card__link

Leitura híbrida

Quando o Intelbot precisou ir além do card

Nos cards com preço explícito, o Intelbot leu o valor direto do bloco .card__description--price.

Nos cards com Confira, o preenchimento do campo preco passou a ser completado por dados estruturados embutidos no runtime da página, como window.__INITIAL_STATE__, dataLayer e application/ld+json.

Isso permitiu fechar a saída com 48 linhas e 48/48 preços preenchidos no teste técnico local.

O que este caso ensinou

Regras práticas para e-commerce difícil

Preço visível nem sempre é suficiente

Se o card traz só Confira, o seletor estrutural pode estar certo e mesmo assim o valor final continuar vazio.

Texto monetário composto exige decisão

Em blocos como R$ 299,99 R$ 269,99 no Pix ou 4x de R$ 75,00, o Intelbot precisa decidir qual valor representa melhor o preço comercial da planilha.

Dado estruturado da página pode salvar a extração

Quando o HTML visível empobrece o card, dados embutidos no runtime podem complementar preço, nome e URL sem exigir inspeção manual do usuário leigo.

Resultado esperado

Quando considerar a categoria resolvida

  • o modo deve sair como list
  • nome e URL devem vir corretos para os produtos da grade
  • preco deve sair numérico mesmo quando o card visível não ajudar
  • a planilha Excel deve sair pronta para uso operacional