Tag: SCRAPY
Soy bastante nuevo usando scrapy y quiero hacer scraping a un sitio web ‘https://in.seamsfriendly.com/collections/shorts’ He escrito el código pero está dando errores de traceback, por favor ayúdame con esto. import scrapy from ..items import SeamsfriendlyItem class SeamsSpider(scrapy.Spider): name = ‘seams’ start_urls = [ ‘https://in.seamsfriendly.com/collections/shorts’ ] def parse(self, response): title : . . . Read more
Estoy creando un rastreador para html. Cada página tiene una etiqueta como esta, Siguiente >> y en la última página no hay esta etiqueta. ¿Cómo puedo obtener cada página? Al principio, pensé que sería así, sin embargo, por alguna razón, no se llama a self.start_request al final. page = 0 . . . Read more
Soy bastante nuevo en scrapy y aquí necesito ayuda con respecto a la URL de la imagen que está en data-src. Aquí está mi código: from typing import Text import scrapy class SeamsSpider(scrapy.Spider): name = ‘seams’ start_urls = [ ‘https://in.seamsfriendly.com/collections/shorts’ ] def parse(self, response): title = response.css(“#shopify-section-collection-template a::text”).extract() price = . . . Read more
Soy nuevo en scrapy. Estaba viendo un tutorial e implementando una spider, pero este error siempre aparece. Por favor ayuda. He intentado en todos lados pero no puedo arreglarlo. Creo que este es el error Este es mi código
En Scrapy Tengo dos funciones, al principio se llama a parse() y luego se llama a parse_each() en parse(). class UtamapSpider(scrapy.Spider): def parse(self, response): yield scrapy.Request(url=each_url, callback=self.parse_each) def parse_each(self,response): Ahora, quiero pasar algunos parámetros adicionales a parse_each. Entonces, lo que quiero hacer es esto. class UtamapSpider(scrapy.Spider): def parse(self, response): yield . . . Read more