Tag: SCRAPY

scrapy: no se encontró la araña (¿nombre o no se obtuvieron datos?)

10 Jun, 2023 Programación 0

Estoy tratando de usar Scrapy para obtener el nombre del producto. Cuando he compilado el entorno de Scrapy y he intentado mi primer intento, falló. La salida muestra: KeyError: “no se encuentra la araña: yahoo” ¿Qué está mal en el código? Espero poder obtener algún consejo. Gracias. “` import scrapy . . . Read more

Scrapy/Python: esperar a que una solicitud de yield termine antes de ejecutar el código (descarga de imágenes)

10 Jun, 2023 Programación 0

Tengo un proyecto cuyo propósito es extraer todos los capítulos de un libro (parsear), luego para cada capítulo, descargar las imágenes (parse_chapter) y crear un archivo PDF para el capítulo (create_pdf). Aquí está mi código (ejemplo mínimo de trabajo): def parse(self, response): chapters = response.xpath(‘/html/body/div[1]/div/div[1]/div/div[4]/div/ul/li[1]/h5/a/@href’) for chapter in chapters: yield . . . Read more

¿Hay alguna forma de controlar programas encontrándolos en el Administrador de tareas y gestionando su contenido?

06 Jun, 2023 Programación 0

Hola, creo que el título de mi pregunta no es suficientemente claro para explicar mi duda, pero estoy intentando entender si hay alguna forma de controlar y automatizar cosas simplemente encontrando tareas desde el administrador de tareas. He visto en Visual Studio “Spy++”. En primer lugar, no entendí cuál era . . . Read more

¿Por qué la CrawlSpider no recolecta enlaces?

05 Jun, 2023 Programación 0

Estoy intentando ejecutar mi primer CrawlSpider, pero el programa termina sin errores, mientras que no devuelve nada, termina con cero resultados. ¿Qué está mal con mi código? from scrapy.spiders import CrawlSpider, Rule from scrapy.linkextractors import LinkExtractor class FagorelectrodomesticoSpider(CrawlSpider): name = ‘fagorelectrodomestico.com’ allowed_domains = [‘fagorelectrodomestico.com’] start_urls = [‘https://fagorelectrodomestico.com’] rules = ( . . . Read more

Función de devolución de llamada con error de Scrapy Python.

05 Jun, 2023 Programación 0

Tengo que rastrear muchos sitios, ¿hay alguna manera? Mi código intentado da un error en la función de retorno, pero no puedo resolverlo. ¿Hay alguna manera de hacer que mi código sea utilizable, o de hacer la devolución de llamada en un formato de lista? Gracias. import scrapy from ..items . . . Read more

1 … 15 16 17 18

es.davy.ai

¿Tienes una pregunta?