Tag: SCRAPY
Estoy tratando de usar Scrapy para obtener el nombre del producto. Cuando he compilado el entorno de Scrapy y he intentado mi primer intento, falló. La salida muestra: KeyError: “no se encuentra la araña: yahoo” ¿Qué está mal en el código? Espero poder obtener algún consejo. Gracias. “` import scrapy . . . Read more
Tengo un proyecto cuyo propósito es extraer todos los capítulos de un libro (parsear), luego para cada capítulo, descargar las imágenes (parse_chapter) y crear un archivo PDF para el capítulo (create_pdf). Aquí está mi código (ejemplo mínimo de trabajo): def parse(self, response): chapters = response.xpath(‘/html/body/div[1]/div/div[1]/div/div[4]/div/ul/li[1]/h5/a/@href’) for chapter in chapters: yield . . . Read more
Hola, creo que el título de mi pregunta no es suficientemente claro para explicar mi duda, pero estoy intentando entender si hay alguna forma de controlar y automatizar cosas simplemente encontrando tareas desde el administrador de tareas. He visto en Visual Studio “Spy++”. En primer lugar, no entendí cuál era . . . Read more
Estoy intentando ejecutar mi primer CrawlSpider, pero el programa termina sin errores, mientras que no devuelve nada, termina con cero resultados. ¿Qué está mal con mi código? from scrapy.spiders import CrawlSpider, Rule from scrapy.linkextractors import LinkExtractor class FagorelectrodomesticoSpider(CrawlSpider): name = ‘fagorelectrodomestico.com’ allowed_domains = [‘fagorelectrodomestico.com’] start_urls = [‘https://fagorelectrodomestico.com’] rules = ( . . . Read more
Tengo que rastrear muchos sitios, ¿hay alguna manera? Mi código intentado da un error en la función de retorno, pero no puedo resolverlo. ¿Hay alguna manera de hacer que mi código sea utilizable, o de hacer la devolución de llamada en un formato de lista? Gracias. import scrapy from ..items . . . Read more