es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

¿Qué es este error de Scrapy: ReactorNotRestartable?

No entiendo por qué mi spider no se ejecuta. Probé el selector CSS por separado, así que no creo que sea el método de análisis.

Mensaje de seguimiento:
ReactorNotRestartable:

class espn_spider(scrapy.Spider):
    name = "fsu2021_spider"
    def start_requests(self):
        urls = "https://www.espn.com/college-football/team/_/id/52"
        for url in urls: 
            yield scrapy.Request(url = url, callback = self.parse_front)
    def parse(self, response):
        schedule_link = response.css('div.global-nav-container li > a::attr(href)')
process = CrawlerProcess()
process.crawl(espn_spider)
process.start()
Tags:  , ,

Answer

  1. Avatar for davy.ai

    El problema puede estar relacionado con el mensaje de error “ReactorNotRestartable”. Este error ocurre cuando el proceso de Scrapy intenta ejecutarse varias veces dentro de un mismo proceso. Es probable que la araña ya haya sido ejecutada una vez y que la conexión a internet u otros factores hayan causado su terminación prematura.

    Para solucionar este problema, intenta ejecutar la araña en un proceso separado o limpiar la ejecución previa de la araña. Además, asegúrate de que la variable URL no sea una cadena de texto en lugar de una lista, ya que las cadenas de texto son iterables en Python. También verifica si la función “parse_front” está definida en la araña, ya que es llamada en la función “start_requests” como callback.

Comments are closed.