es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: BEAUTIFULSOUP

Extracción de datos de fútbol en la web

Me gustaría extraer los datos de un sitio web “https://www.maxifoot.fr/classement-buteur-europe-annee-civile-2021.htm”. Intenté extraer estos datos en Python pero no pude hacerlo. Me gustaría crear una tabla en Python con esos datos y los mismos campos. ¿Alguien puede intentar ayudarme con el script para la extracción de datos utilizando pandas, beautifulsoup…? Ya . . . Read more

¿Cómo analizar XML con espacios de nombres en etiquetas usando BeautifulSoup?

Tengo un enlace XML (http://api.worldbank.org/v2/countries) con los siguientes datos: <!– language: lang-xml –> <wb:countries xmlns:wb=”http://www.worldbank.org” page=”1″ pages=”6″ per_page=”50″ total=”299″> <wb:country id=”ABW”> <wb:iso2code>AW</wb:iso2code> <wb:name>Aruba</wb:name> <wb:region id=”LCN” iso2code=”ZJ”>América Latina y el Caribe </wb:region> <wb:adminregion id=”” iso2code=””></wb:adminregion> <wb:incomelevel id=”HIC” iso2code=”XD”>Ingreso alto</wb:incomelevel> <wb:lendingtype id=”LNX” iso2code=”XX”>No clasificado</wb:lendingtype> <wb:capitalcity>Oranjestad</wb:capitalcity> <wb:longitude>-70.0167</wb:longitude> <wb:latitude>12.5167</wb:latitude> </wb:country> <wb:country id=”AFE”> <wb:iso2code>ZH</wb:iso2code> <wb:name>África . . . Read more

Mismos valores devueltos al realizar el scraping con BeautifulSoup

Estoy tratando de extraer información sobre acciones ETF de tecnología de https://etfdb.com/etfs/sector/technology/#etfs&sortname=assetsundermanagement&sortorder=desc&page=1 como un proyecto personal. Lo que estoy intentando hacer es extraer las tablas mostradas en cada una de las páginas, pero parece que siempre devuelve los mismos valores, aunque actualice el número de página en la URL. ¿Hay . . . Read more

Web Scraping / Web Crawling Web scraping / rastreo web

¿Alguien puede ayudarme a descubrir cómo extraer / rastrear este sitio web? https://www.arkansasonline.com/i/lrcrime/ He descargado la fuente de la página con “requests” y la he analizado con “BeautifulSoup”, pero no puedo entender qué está sucediendo. Aquí está lo que tengo hasta ahora: ##################################################### import requests from bs4 import BeautifulSoup url . . . Read more