es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: BEAUTIFULSOUP

¿Cómo raspar una tabla paginada con BeautifulSoup y almacenar los resultados en un archivo CSV?

Quiero extraer datos de https://www.airport-data.com/manuf/Reims.html y recorrer todos los registros para guardar los resultados en el archivo “AircraftListing.csv”. El código se ejecuta sin errores, pero los resultados se almacenan incorrectamente y no se extraen todos los registros de la página web al archivo .csv. ¿Cómo puedo obtener todos los registros . . . Read more

Python beautifulsoup y openpyxl

Entonces, estoy tratando de usar BeautifulSoup para extraer datos (un rastreador/web scraper) y estoy tratando de iterar sobre cada etiqueta en el HTML para encontrar los datos que quiero. Mi objetivo es obtener una información específica y ponerla en una hoja de cálculo de Excel con la biblioteca de openpyxl. . . . Read more

Cómo extraer una tabla dinámica de wunderground.

Estoy teniendo problemas para extraer una tabla con python. El ejemplo es la tabla grande en un sitio web de historial meteorológico con todos los números cada hora. url= “https://www.wunderground.com/history/daily/us/va/arlington-county/KDCA/date/2019-1-25” page = requests.get(url) soup = BeautifulSoup(page.text, “html.parser”) my_table = soup.find(“table”, class_ = “mat-table cdk-table mat-sort ng-star-inserted”) print(my_table) Obtuve el atributo . . . Read more

La búsqueda recursiva con BeautifulSoup es muy lenta.

Estoy construyendo un rastreador que descarga todos los archivos .pdf de un sitio web dado y sus subpáginas. Para ello, he utilizado funcionalidades incorporadas alrededor de la siguiente función recursiva simplificada que recupera todos los enlaces de una URL dada. Sin embargo, esto se vuelve bastante lento a medida que . . . Read more