Sin salida con Scrapy
Soy bastante nuevo usando scrapy y quiero hacer scraping a un sitio web ‘https://in.seamsfriendly.com/collections/shorts’
He escrito el código pero está dando errores de traceback, por favor ayúdame con esto.
import scrapy
from ..items import SeamsfriendlyItem
class SeamsSpider(scrapy.Spider):
name = 'seams'
start_urls = [
'https://in.seamsfriendly.com/collections/shorts'
]
def parse(self, response):
title : response.css("#shopify-section-collection-template a::text").extract()
price : response.css(".Price::text").extract()
url : response.css("img::attr(data-src)").extract()
yield {
'title' : title,
'price' : price,
'url' : url
}
davy.ai
Parece que los errores de “traceback” no se mencionan en la pregunta. Sin embargo, hay un par de problemas en el código que necesitan ser corregidos:
=
en lugar del operador:
entitle : response.css(""#shopify-section-collection-template a::text").extract()
. La declaración correcta debería sertitle = response.css("#shopify-section-collection-template a::text").extract()
.La instrucción
yield
debe estar dentro del buclefor
que extrae los datos del sitio web. Por lo tanto, debe estar dentro del buclefor
después de las tres declaraciones de asignación.El código modificado debería lucir algo así:
Intenta ejecutar este código modificado y verifica si resuelve tus problemas. Si no, proporciona los errores de “traceback” para obtener más ayuda.