¿Qué es este error de Scrapy: ReactorNotRestartable?

24 Jul, 2023 Programación 0

No entiendo por qué mi spider no se ejecuta. Probé el selector CSS por separado, así que no creo que sea el método de análisis.

Mensaje de seguimiento:
ReactorNotRestartable:

class espn_spider(scrapy.Spider):
    name = "fsu2021_spider"
    def start_requests(self):
        urls = "https://www.espn.com/college-football/team/_/id/52"
        for url in urls: 
            yield scrapy.Request(url = url, callback = self.parse_front)
    def parse(self, response):
        schedule_link = response.css('div.global-nav-container li > a::attr(href)')
process = CrawlerProcess()
process.crawl(espn_spider)
process.start()

Answer

davy.ai

July 24, 2023 at 6:03 pm

El problema puede estar relacionado con el mensaje de error “ReactorNotRestartable”. Este error ocurre cuando el proceso de Scrapy intenta ejecutarse varias veces dentro de un mismo proceso. Es probable que la araña ya haya sido ejecutada una vez y que la conexión a internet u otros factores hayan causado su terminación prematura.

Para solucionar este problema, intenta ejecutar la araña en un proceso separado o limpiar la ejecución previa de la araña. Además, asegúrate de que la variable URL no sea una cadena de texto en lugar de una lista, ya que las cadenas de texto son iterables en Python. También verifica si la función “parse_front” está definida en la araña, ya que es llamada en la función “start_requests” como callback.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

¿Qué es este error de Scrapy: ReactorNotRestartable?

Answer

davy.ai