Nome do campo: nome
Tipo: string
Descrição: Nome do livro no card da listagem
Hint de seletor: article.product_pod h3 a
Exemplo guiado
Este é um catálogo de produtos com cards repetidos e estrutura regular. É um dos melhores tipos de site para aprender como usar selectorHint em extrações no modo list.
Objetivo
URL alvo:
books.toscrape.com/catalogue/a-light-in-the-attic_1000/index.html
Como preencher
No modo da extração, selecione list. Cada dado que você quer extrair pede um set próprio no Intelbot com:
Nome do campo: nome
Tipo: string
Descrição: Nome do livro no card da listagem
Hint de seletor: article.product_pod h3 a
Nome do campo: preço
Tipo: number
Descrição: Preço do livro no card da listagem
Hint de seletor: article.product_pod .price_color
Nome do campo: url
Tipo: url
Descrição: URL do livro no card da listagem
Hint de seletor: article.product_pod h3 a
Estrutura do item
Um item da listagem costuma aparecer assim:
<article class="product_pod"><h3><a href="https://books.toscrape.com/catalogue/a-light-in-the-attic_1000/index.html">A Light in the Attic</a></h3><p class="price_color">£51.77</p></article>O Intelbot precisa entender que o nome, a URL e o preço, todos pertencem a esse mesmo item.
Como descobrir
Clique com o botão direito no título de um livro, escolha Inspecionar e observe que o card do livro usa um padrão como:
<article class="product_pod"><h3><a href="catalogue/...">A Light in the Attic</a></h3></article>O seletor estrutural mais útil aqui é:
article.product_pod h3 aEle funciona para o texto do nome e para a URL do link.
Como descobrir
Inspecione o preço e procure o elemento com a classe que se repete em todos os cards:
<p class="price_color">£51.77</p>O seletor fica:
article.product_pod .price_colorErros comuns
Errado porque a página tem muitos livros. O modo correto é list.
Se a descrição falar em página inteira, a heurística pode puxar título da home ou dados soltos em vez de um item do card.
A heurística pode até funcionar, mas em listas o resultado fica menos consistente do que com seletor por card.
Resultado esperado