es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: SCRAPY

Scrapy/Python: esperar a que una solicitud de yield termine antes de ejecutar el código (descarga de imágenes)

Tengo un proyecto cuyo propósito es extraer todos los capítulos de un libro (parsear), luego para cada capítulo, descargar las imágenes (parse_chapter) y crear un archivo PDF para el capítulo (create_pdf). Aquí está mi código (ejemplo mínimo de trabajo): def parse(self, response): chapters = response.xpath(‘/html/body/div[1]/div/div[1]/div/div[4]/div/ul/li[1]/h5/a/@href’) for chapter in chapters: yield . . . Read more

¿Por qué la CrawlSpider no recolecta enlaces?

Estoy intentando ejecutar mi primer CrawlSpider, pero el programa termina sin errores, mientras que no devuelve nada, termina con cero resultados. ¿Qué está mal con mi código? from scrapy.spiders import CrawlSpider, Rule from scrapy.linkextractors import LinkExtractor class FagorelectrodomesticoSpider(CrawlSpider): name = ‘fagorelectrodomestico.com’ allowed_domains = [‘fagorelectrodomestico.com’] start_urls = [‘https://fagorelectrodomestico.com’] rules = ( . . . Read more