Usando BeautifulSoup para extraer parte del nombre de la clase.

davy.ai

June 10, 2023 at 2:56 pm

El código anterior debería extraer el texto “Alaska Airlines 398” del elemento div que tiene un nombre de clase que contiene “carrier-text”. Sin embargo, no funciona porque el nombre de clase en el código HTML es “dErF-carrier-text” y no solo “carrier-text”.

Para extraer la información basada en una parte del nombre de la clase, puede utilizar el módulo re en Python para buscar un patrón en el nombre de la clase. Aquí está un ejemplo de código:

import re
from bs4 import BeautifulSoup

html = """
<div class="dErF-carrier-text">
Alaska Airlines 398 </div>
"""

soup = BeautifulSoup(html, 'html.parser')
patrón = re.compile(r"carrier-text")
texto = soup.find('div', class_=patrón).text.strip()

print(texto)  # output: Alaska Airlines 398

En este código, primero importamos el módulo re y creamos un patrón de expresión regular que coincida con cualquier nombre de clase que contenga la cadena “carrier-text”.

Luego, pasamos este patrón al argumento class_ de la función soup.find () para encontrar el elemento div con un nombre de clase coincidente. También usamos el método`strip () para eliminar cualquier espacio en blanco que pueda encontrar en el texto extraído.

Finalmente, imprimimos el texto extraído, que ahora debería ser “Alaska Airlines 398”.

Answer

davy.ai

June 10, 2023 at 2:56 pm
El código anterior debería extraer el texto “Alaska Airlines 398” del elemento div que tiene un nombre de clase que contiene “carrier-text”. Sin embargo, no funciona porque el nombre de clase en el código HTML es “dErF-carrier-text” y no solo “carrier-text”.

Para extraer la información basada en una parte del nombre de la clase, puede utilizar el módulo re en Python para buscar un patrón en el nombre de la clase. Aquí está un ejemplo de código:
```
import re
from bs4 import BeautifulSoup

html = """
<div class="dErF-carrier-text">
Alaska Airlines 398 </div>
"""

soup = BeautifulSoup(html, 'html.parser')
patrón = re.compile(r"carrier-text")
texto = soup.find('div', class_=patrón).text.strip()

print(texto)  # output: Alaska Airlines 398
```
En este código, primero importamos el módulo re y creamos un patrón de expresión regular que coincida con cualquier nombre de clase que contenga la cadena “carrier-text”.

Luego, pasamos este patrón al argumento class_ de la función soup.find () para encontrar el elemento div con un nombre de clase coincidente. También usamos el método`strip () para eliminar cualquier espacio en blanco que pueda encontrar en el texto extraído.

Finalmente, imprimimos el texto extraído, que ahora debería ser “Alaska Airlines 398”.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Usando BeautifulSoup para extraer parte del nombre de la clase.

Answer

davy.ai