Exemplo guiado

lojanimal.com.br

Este caso mostra uma regra importante para e-commerce: a extração deve começar por uma página de categoria estável, não pela home. Na Loja Animal, a categoria entregou uma planilha limpa, enquanto a home gerou duplicações e mistura de vitrines.

e-commercemodo listcategoria em vez de home

Objetivo

Extrair produtos para Excel

  • nome
  • preço
  • url

URL alvo:

www.lojanimal.com.br/gatos/latas-e-saches

Regra principal

Nunca comece pela home da loja

Em loja virtual, a home quase sempre mistura blocos como destaque, promoção, mais vendidos e vitrines com slider. Isso aumenta a chance de o Intelbot ler o mesmo produto duas vezes ou alinhar preço de um card com URL de outro.

A página de categoria costuma ser melhor porque traz uma grade repetida, previsível e mais adequada para exportação em XLSX.

Como preencher

Schema revisado antes de publicar

No modo da extração, selecione list. Depois preencha um set por campo com:

  • Nome do campo
  • Tipo
  • Descrição
  • Hint de seletor

Nome do campo: nome

Tipo: string

Descrição: Nome do produto no card da listagem

Hint de seletor: .product-name

Nome do campo: preço

Tipo: number

Descrição: Preço do produto no card da listagem

Hint de seletor: .product-price

Nome do campo: url

Tipo: url

Descrição: URL do produto no card da listagem

Hint de seletor: .product > a

Estrutura do item

Como ler a grade mentalmente

Um item da categoria costuma aparecer assim:

<li class="product col-sm-4 col-xs-12"><div class="product product-1"><a href="https://www.lojanimal.com.br/gatos/latas-e-saches/..."><div class="product-name">Cat Chow Sachê Adultos Frango ao Molho 85g</div><div class="product-price"><span>R$ 4,25</span></div></a></div></li>

O Intelbot precisa entender que nome, preço e URL pertencem ao mesmo card da grade.

Como descobrir

Nome e URL

Inspecione um produto da categoria. O nome aparece em .product-name e o link principal do card fica em .product > a.

<a href="https://www.lojanimal.com.br/gatos/latas-e-saches/cat-chow-sache-adultos-frango-ao-molho-85g"><div class="product-name">Cat Chow Sachê Adultos Frango ao Molho 85g</div></a>

Como o campo url é do tipo url, o Intelbot lê o href do link em vez do texto inteiro do card.

Como descobrir

Preço

O preço do card aparece em .product-price. O tipo number converte o valor visual em número.

<div class="product-price"><span>R$ 4,25</span></div>

Nesse teste, usar a categoria evitou os preços nulos e o desalinhamento que apareceram quando a origem foi a home.

O que evitar

Erros comuns neste tipo de loja

Não usar a home da loja

A home mistura destaques, promoções, mais vendidos e carrosséis clonados, o que produz duplicação e desalinhamento.

Não insistir em descrição no primeiro teste

Em muitas categorias a descrição não aparece de forma consistente no card. Comece com nome, preço e URL.

Não tratar vitrine rotativa como grade limpa

Slider de home pode repetir o mesmo produto mais de uma vez e quebrar a planilha final.

Resultado esperado

Como saber se ficou bom

  • o retorno deve sair com mode igual a list
  • cada item deve ter nome, preço e url completos
  • não deve haver duplicação gritante de produtos
  • o arquivo Excel deve refletir a grade da categoria, não várias vitrines da home