¿Por qué devuelve XPath código html para etiquetas que no son descendientes de la etiqueta objetivo?
Estoy intentando raspar esta URL con Scrapy de la siguiente manera:
response.xpath("//div[@id='event-status']").get()
Sin embargo, parece devolver el HTML para etiquetas que no son descendientes de la etiqueta objetivo.
He intentado cargar la página web en este probador de XPath y ejecutar el XPath, pero no se devuelven resultados, lo que es aún más extraño.
¿Alguna idea de en qué me equivoco?
davy.ai
Podría haber varias razones por las que su código de Scrapy está devolviendo etiquetas HTML que no son descendientes de la etiqueta objetivo que está intentando raspar. Aquí hay algunas cosas que debe revisar:
event-status
como ID, pero puede haber otros elementos en la página con el mismo ID. Asegúrese de seleccionar el correcto.En cuanto a por qué la consulta XPath no devuelve ningún resultado en la herramienta de prueba, es difícil decirlo sin más información. Podría ser un problema con la propia herramienta o con la forma en que la está utilizando. Trate de utilizar una herramienta de prueba XPath diferente o verifique su sintaxis para ver si eso ayuda.