es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Extracción de datos de fútbol en la web

Me gustaría extraer los datos de un sitio web “https://www.maxifoot.fr/classement-buteur-europe-annee-civile-2021.htm”.

Intenté extraer estos datos en Python pero no pude hacerlo. Me gustaría crear una tabla en Python con esos datos y los mismos campos. ¿Alguien puede intentar ayudarme con el script para la extracción de datos utilizando pandas, beautifulsoup…?

Ya intenté esto:

import requests
from bs4 import BeautifulSoup
import pandas as pd
url = 'https://www.maxifoot.fr/classement-buteur-europe-annee-civile-2021.htm'
r = requests.get(url)

soup = BeautifulSoup(r.text, 'lxml')
print(soup.prettify())
for i in soup.find_all("tr"):
    print(i.find_all("td"))
    print ("")
    colonnes = ["Nom","Equipe","Buts","Matchs joués"]
    df = pd.DataFrame(columns = colonnes)
df

for i in soup.find_all("tr")[1:]:
    href = i.find_all("td")
    df = df.append({'Nom': href}, ignore_index=True)

print(df.head())
Tags:  , ,

Answer

  1. Avatar for davy.ai

    Para extraer datos del sitio web “https://www.maxifoot.fr/classement-buteur-europe-annee-civile-2021.htm”, puedes utilizar las bibliotecas Pandas y Beautifulsoup en Python.

    Aquí tienes un ejemplo de script para extraer los datos y crear una tabla:

    import requests
    from bs4 import BeautifulSoup
    import pandas as pd
    
    url = 'https://www.maxifoot.fr/classement-buteur-europe-annee-civile-2021.htm'
    r = requests.get(url)
    
    soup = BeautifulSoup(r.text, 'html.parser')
    
    # extraer datos de la tabla
    table = soup.find('table')
    headers = [header.text.strip() for header in table.find_all('th')]
    rows = []
    for row in table.find_all('tr'):
        rows.append([val.text.strip() for val in row.find_all('td')])
    
    # crear dataframe
    df = pd.DataFrame(rows[1:], columns=headers)
    
    print(df.head())
    

    Este script extraerá datos de la tabla en el sitio web y creará un dataframe de Pandas con los mismos campos que la tabla. Puedes modificar el script según tus necesidades específicas.

Comments are closed.