Xpath de las siguientes propiedades

davy.ai

June 17, 2023 at 10:26 pm

Sí, hay una forma de seleccionar la fecha y hora de cada fila en la página web utilizando xpath. Puede utilizar xpath relativo para seleccionar la fecha y hora de cada fila en la tabla. Aquí hay un ejemplo de xpath relativo para seleccionar la fecha y hora de las primeras cinco filas:

Fila 1: ./td[1]
Fila 2: ./following-sibling::tr[1]/td[1]
Fila 3: ./following-sibling::tr[2]/td[1]
Fila 4: ./following-sibling::tr[3]/td[1]
Fila 5: ./following-sibling::tr[4]/td[1]

En scrapy, puede utilizar el método response.xpath() para seleccionar estos elementos. Aquí hay un ejemplo de fragmento de código para extraer la fecha y hora de todas las filas en la tabla:

import scrapy

class MySpider(scrapy.Spider):
    name = "my_spider"
    start_urls = [
        "https://geoinfo.nmt.edu/nmtso/events/home.cfml"
    ]

    def parse(self, response):
        for row in response.xpath("//table/tbody/tr"):
            date_time = row.xpath("./td[1]/text()").get()
            yield {
                "date_time": date_time
            }

Este código extraerá la fecha y hora de cada fila en la tabla y generará un diccionario con los datos extraídos. También puede modificar el xpath para extraer otros datos de la tabla.

Answer

davy.ai

June 17, 2023 at 10:26 pm
Sí, hay una forma de seleccionar la fecha y hora de cada fila en la página web utilizando xpath. Puede utilizar xpath relativo para seleccionar la fecha y hora de cada fila en la tabla. Aquí hay un ejemplo de xpath relativo para seleccionar la fecha y hora de las primeras cinco filas:
- Fila 1: ./td[1]
- Fila 2: ./following-sibling::tr[1]/td[1]
- Fila 3: ./following-sibling::tr[2]/td[1]
- Fila 4: ./following-sibling::tr[3]/td[1]
- Fila 5: ./following-sibling::tr[4]/td[1]
En scrapy, puede utilizar el método response.xpath() para seleccionar estos elementos. Aquí hay un ejemplo de fragmento de código para extraer la fecha y hora de todas las filas en la tabla:
```
import scrapy

class MySpider(scrapy.Spider):
    name = "my_spider"
    start_urls = [
        "https://geoinfo.nmt.edu/nmtso/events/home.cfml"
    ]

    def parse(self, response):
        for row in response.xpath("//table/tbody/tr"):
            date_time = row.xpath("./td[1]/text()").get()
            yield {
                "date_time": date_time
            }
```
Este código extraerá la fecha y hora de cada fila en la tabla y generará un diccionario con los datos extraídos. También puede modificar el xpath para extraer otros datos de la tabla.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Xpath de las siguientes propiedades

Answer

davy.ai