es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: WEB-SCRAPING

Error de decodificación de JSON: Se esperaba un valor: línea 1, columna 1 (carácter 0). Estoy obteniendo este error.

Cómo solucionar este error JSONDecodeError: Se esperaba un valor: línea 1 columna 1 (carácter 0)? A continuación se muestra el código: from urllib.request import urlopen api_url = “https://samples.openweathermap.org/data/2.5/weatherq=London&mode=html&appid=b6907d289e10d714a6e88b30761fae22” url_result = urlopen(api_url) data = url_result.read() data = data.decode(‘utf-8’) import json json_data = json.loads(data)

Puppeteer page.goto(url) dentro de un bucle no espera hasta que se cargue

Tengo URLs de archivos PDF. ej: const filesUrl= [“http://example.com/animal.pdf”, “https://example.com/fruit.pdf”, “http://example.com/stars.pdf”] Quiero descargar esos archivos y guardarlos en mi carpeta de servidor usando Puppeteer. Lo que estoy haciendo es: 1. Recorrer filesUrl. 2. En cada recorrido, uso page.goto(url). 3. Escribir el archivo usando fs.writeFile. 4. Siguiente recorrido. Pero tengo el . . . Read more

Extracción de datos de fútbol en la web

Me gustaría extraer los datos de un sitio web “https://www.maxifoot.fr/classement-buteur-europe-annee-civile-2021.htm”. Intenté extraer estos datos en Python pero no pude hacerlo. Me gustaría crear una tabla en Python con esos datos y los mismos campos. ¿Alguien puede intentar ayudarme con el script para la extracción de datos utilizando pandas, beautifulsoup…? Ya . . . Read more

¿Cómo analizar XML con espacios de nombres en etiquetas usando BeautifulSoup?

Tengo un enlace XML (http://api.worldbank.org/v2/countries) con los siguientes datos: <!– language: lang-xml –> <wb:countries xmlns:wb=”http://www.worldbank.org” page=”1″ pages=”6″ per_page=”50″ total=”299″> <wb:country id=”ABW”> <wb:iso2code>AW</wb:iso2code> <wb:name>Aruba</wb:name> <wb:region id=”LCN” iso2code=”ZJ”>América Latina y el Caribe </wb:region> <wb:adminregion id=”” iso2code=””></wb:adminregion> <wb:incomelevel id=”HIC” iso2code=”XD”>Ingreso alto</wb:incomelevel> <wb:lendingtype id=”LNX” iso2code=”XX”>No clasificado</wb:lendingtype> <wb:capitalcity>Oranjestad</wb:capitalcity> <wb:longitude>-70.0167</wb:longitude> <wb:latitude>12.5167</wb:latitude> </wb:country> <wb:country id=”AFE”> <wb:iso2code>ZH</wb:iso2code> <wb:name>África . . . Read more