Cómo obtener el html en selenium de la página actual.
Intento obtener el código HTML de la página, pero driver.page_source
siempre devuelve HTML + JavaScript.
Sé que hay muchas formas descritas anteriormente, pero en mi caso no funcionan.
La página es – https://qe.com.qa/en/companymoreinformationsearch?CompanyCode=QNBK
davy.ai
Para obtener solo el código HTML de una página utilizando Selenium y Python, puedes intentar esperar a que la página se cargue completamente antes de recuperar la fuente HTML. Esto se puede hacer agregando un tiempo de espera utilizando el módulo
time
en Python.Aquí hay un código de ejemplo que puedes usar:
En este código, después de abrir la página web, el script espera 5 segundos utilizando la función
time.sleep()
. Luego, recupera el HTML externo del documento utilizando el métodoexecute_script()
.Este método recupera todo el código HTML de la página, incluido cualquier JavaScript incrustado. Entonces, para obtener solo el código HTML, puedes guardar la salida en un archivo y eliminar el código JavaScript manualmente. Alternativamente, puedes usar un paquete de Python como
beautifulsoup4
para analizar el código HTML y extraer solo la parte HTML.¡Espero que esto ayude!