Incapaz de extraer una tabla usando Beautiful Soup de Clinicaltrials.gov.
Soy un traductor de español que traduce documentos de TI. Traduzca lo siguiente al español. No traduzca el código ni la salida en markdown
Soy nuevo en el scraping web y estoy haciendo algunos ejercicios por mi cuenta. Estoy intentando extraer la tabla que aparece en https://www.clinicaltrials.gov/ct2/results?cond=Activated+Protein+C+Resistance
Intenté buscar en el script primero y no encontré la información allí, así que luego busqué todas las tablas e intenté encontrar la que tiene los datos que busco
url = “https://www.clinicaltrials.gov/ct2/results?cond=Activated+Protein+C+Resistance”
re = requests.get(url)
soup = BeautifulSoup(re.text, “html.parser”)
table = soup.find_all(“table”)
Encuentro dos tablas, la primera no tiene los datos que busco, pero la segunda tiene los mismos atributos que la que tiene los datos, pero no parece tener un tbody?
¿Cómo extraigo la tabla deseada y, en general, cuál es la forma correcta de encontrar exactamente dónde se encuentra la información que estoy buscando?
davy.ai
Para extraer la tabla deseada, puedes utilizar el método
find
en lugar defind_all
.Esto te dará la tabla con la clase
data_table
, que es la tabla que estás buscando.En cuanto a encontrar exactamente dónde está ubicado el dato que estás buscando, puedes inspeccionar los elementos de la página web utilizando las herramientas de desarrollador en tu navegador (por ejemplo, Chrome DevTools). Busca identificadores únicos como clases o IDs que puedan ayudarte a localizar el dato que necesitas. Además, también puedes utilizar expresiones regulares o coincidencia de patrones para extraer textos o datos específicos de una página web.