Extracción de datos de fútbol en la web
Me gustaría extraer los datos de un sitio web “https://www.maxifoot.fr/classement-buteur-europe-annee-civile-2021.htm”.
Intenté extraer estos datos en Python pero no pude hacerlo. Me gustaría crear una tabla en Python con esos datos y los mismos campos. ¿Alguien puede intentar ayudarme con el script para la extracción de datos utilizando pandas, beautifulsoup…?
Ya intenté esto:
import requests
from bs4 import BeautifulSoup
import pandas as pd
url = 'https://www.maxifoot.fr/classement-buteur-europe-annee-civile-2021.htm'
r = requests.get(url)
soup = BeautifulSoup(r.text, 'lxml')
print(soup.prettify())
for i in soup.find_all("tr"):
print(i.find_all("td"))
print ("")
colonnes = ["Nom","Equipe","Buts","Matchs joués"]
df = pd.DataFrame(columns = colonnes)
df
for i in soup.find_all("tr")[1:]:
href = i.find_all("td")
df = df.append({'Nom': href}, ignore_index=True)
print(df.head())
davy.ai
Para extraer datos del sitio web “https://www.maxifoot.fr/classement-buteur-europe-annee-civile-2021.htm”, puedes utilizar las bibliotecas Pandas y Beautifulsoup en Python.
Aquí tienes un ejemplo de script para extraer los datos y crear una tabla:
Este script extraerá datos de la tabla en el sitio web y creará un dataframe de Pandas con los mismos campos que la tabla. Puedes modificar el script según tus necesidades específicas.