Encontrar href en una página web

17 Jul, 2023 Programación 0

No entiendo por qué lo siguiente no funcionará; estoy buscando y tratando de hacer clic en este enlace específico:

<a href="#/documents/2077">

Desde la URL: https://species-registry.canada.ca/index-en.html#/documents?documentTypeId=18&sortBy=documentTypeSort&sortDirection=asc&pageSize=10&keywords=Victoria%27s%20Owl-clover

A partir de ese URL, he intentado algunas cosas, incluyendo lo siguiente:

Intento #1

WebDriverWait(driver, 20).until(EC.element_to_be_clickable((By.PARTIAL_LINK_TEXT, "COSEWIC-Assessment-and-status-report")))

appraisal_html = driver.find_element_by_partial_link_text("COSEWIC-Assessment-and-status-report")

Intento #2

soup = bs(req.text, 'html.parser')
for link in soup.find_all('a'):
    print(link.get('href'))

Entre otras cosas. Teniendo en cuenta que esta es una búsqueda generalizada en el sentido de que el nombre de la especie cambiará cada vez que haga esta búsqueda, todo lo demás debería ser similar.

El segundo intento es directamente de la documentación de Beautiful Soup y encuentra un montón de enlaces como los que se encuentran bajo la pestaña del menú, etc., pero no el href que estoy buscando.

Por alguna razón, el primer intento simplemente se agota sin encontrar el texto parcial que ingresé. ¿Quizás esto se debe a que es el texto en la página y no el href en sí?

Una solución que no estoy considerando es buscar el cuadro delimitador dentro del cual se encuentra el enlace primero y luego buscar el enlace dentro de una nueva área de búsqueda más pequeña, pero aún así no sé por qué no puedo encontrar el enlace correcto desde toda la página.

es.davy.ai

¿Tienes una pregunta?

Encontrar href en una página web

Answer

davy.ai