Incapaz de extraer una tabla usando Beautiful Soup de Clinicaltrials.gov.

Soy un traductor de español que traduce documentos de TI. Traduzca lo siguiente al español. No traduzca el código ni la salida en markdown

Soy nuevo en el scraping web y estoy haciendo algunos ejercicios por mi cuenta. Estoy intentando extraer la tabla que aparece en https://www.clinicaltrials.gov/ct2/results?cond=Activated+Protein+C+Resistance

Intenté buscar en el script primero y no encontré la información allí, así que luego busqué todas las tablas e intenté encontrar la que tiene los datos que busco

url = “https://www.clinicaltrials.gov/ct2/results?cond=Activated+Protein+C+Resistance”
re = requests.get(url)
soup = BeautifulSoup(re.text, “html.parser”)
table = soup.find_all(“table”)

Encuentro dos tablas, la primera no tiene los datos que busco, pero la segunda tiene los mismos atributos que la que tiene los datos, pero no parece tener un tbody?

¿Cómo extraigo la tabla deseada y, en general, cuál es la forma correcta de encontrar exactamente dónde se encuentra la información que estoy buscando?

davy.ai

June 4, 2023 at 1:14 pm

Para extraer la tabla deseada, puedes utilizar el método find en lugar de find_all.

url = "https://www.clinicaltrials.gov/ct2/results?cond=Activated+Protein+C+Resistance"
re = requests.get(url)
soup = BeautifulSoup(re.text, "html.parser")
table = soup.find("table", {"class": "data_table"})

Esto te dará la tabla con la clase data_table, que es la tabla que estás buscando.

En cuanto a encontrar exactamente dónde está ubicado el dato que estás buscando, puedes inspeccionar los elementos de la página web utilizando las herramientas de desarrollador en tu navegador (por ejemplo, Chrome DevTools). Busca identificadores únicos como clases o IDs que puedan ayudarte a localizar el dato que necesitas. Además, también puedes utilizar expresiones regulares o coincidencia de patrones para extraer textos o datos específicos de una página web.

Answer

davy.ai

June 4, 2023 at 1:14 pm
Para extraer la tabla deseada, puedes utilizar el método find en lugar de find_all.
```
url = "https://www.clinicaltrials.gov/ct2/results?cond=Activated+Protein+C+Resistance"
re = requests.get(url)
soup = BeautifulSoup(re.text, "html.parser")
table = soup.find("table", {"class": "data_table"})
```
Esto te dará la tabla con la clase data_table, que es la tabla que estás buscando.

En cuanto a encontrar exactamente dónde está ubicado el dato que estás buscando, puedes inspeccionar los elementos de la página web utilizando las herramientas de desarrollador en tu navegador (por ejemplo, Chrome DevTools). Busca identificadores únicos como clases o IDs que puedan ayudarte a localizar el dato que necesitas. Además, también puedes utilizar expresiones regulares o coincidencia de patrones para extraer textos o datos específicos de una página web.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Incapaz de extraer una tabla usando Beautiful Soup de Clinicaltrials.gov.

Answer

davy.ai