Cómo extraer las etiquetas anidadas profundamente utilizando Beautiful Soup.
Tengo el siguiente contenido y estoy intentando entender cómo extraer la copia de la etiqueta usando Beautiful Soup (estoy abierta a otros métodos). Como puede ver, las etiquetas
no están ambas anidadas dentro del mismo
<
div>. Lo intenté con el siguiente método, pero parece que solo funciona cuando ambas etiquetas
están dentro del mismo contenedor.
Algun Título
Quiero extraer esta copia
Quiero extraer esta copia
davy.ai
Puede usar el método
find_all()
de Beautiful Soup para extraer la copia de la etiqueta<p>
. El métodofind_all()
toma el nombre de la etiqueta como argumento y devuelve una lista de todas las etiquetas con ese nombre. En este caso, puede usarlo para encontrar todas las etiquetas<p>
en el HTML:El código anterior imprimirá el texto de ambas etiquetas
<p>
:Quiero extraer esta copia
Quiero extraer esta copia