Tag: WEB-SCRAPING

¿Cómo puedo raspar una etiqueta de tabla anidada oculta con BeautifulSoup y Python?

31 Jul, 2023 Programación 0

He estado tratando de encontrar la tabla de este sitio web: https://consultas.anvisa.gov.br/#/medicamentos/25351532892201972/ Estoy utilizando el siguiente método: from bs4 import BeautifulSoup import requests url = “https://consultas.anvisa.gov.br/#/medicamentos/25351532892201972/” page = requests.get(url, verify=False) soup = BeautifulSoup(page.content, ‘html.parser’) print(soup.prettify()) for table in soup.find_all(‘table’): print(table) for subtable in table.find_all(‘table’): print(subtable) No muestra ningún resultado, porque . . . Read more

¿Por qué un web scraper básico en JavaScript lanza un error / XPATH no resuelto?

31 Jul, 2023 Programación 0

Intenté escribir un web scraper con la biblioteca Puppeteer. Funcionó correctamente en amazon.com, pero al intentarlo en otra página (coinhall.org) obtengo un error que no puedo resolver. ¿Alguien puede indicarme la dirección correcta aquí? const [el2] = await page.$x(‘//*[@id=”root”]/div/div[4]/div/div[1]/div[1]/div[2]/div[1]/div[2]/div[1]/div[1]’); const txt = await el2.getProperty(‘textContent’); const rawTxt = txt.jsonValue(); Error: const . . . Read more

Error: referencia de elemento obsoleto: el elemento no está adjunto al documento de la página después de regresar una página

31 Jul, 2023 Programación 0

Actualmente estoy creando un script en Python que ingresa a https://www.mwcbarcelona.com/exhibitors, hace clic en cada expositor y luego regresa a la misma página para hacer clic en el siguiente expositor. Este es el código que he escrito: from bs4 import BeautifulSoup import requests import csv import pandas as pd from . . . Read more

Beautiful Soup y el método find_all no enumeran todas las etiquetas en el archivo de texto.

30 Jul, 2023 Programación 0

Estoy tratando de raspar un sitio web que he colocado en un archivo HTML local. Cuando uso el método find_all(), puedo obtener todo el texto de las etiquetas mostradas en los resultados de Python. El problema está en que no puedo hacer que se muestre todo el texto en un . . . Read more

Optimizar el web scraping con Rselenium

30 Jul, 2023 Programación 0

Estoy haciendo web scraping en una página web dinámica y me gustaría optimizar el proceso ya que es muy lento. La página web muestra una serie de ventas con información y a medida que se desplaza hacia abajo, aparecen más ventas, aunque hay un número finito de ventas. Lo que . . . Read more

1 … 11 12 13 … 89

es.davy.ai

¿Tienes una pregunta?

Tag: WEB-SCRAPING

¿Cómo puedo raspar una etiqueta de tabla anidada oculta con BeautifulSoup y Python?

¿Por qué un web scraper básico en JavaScript lanza un error / XPATH no resuelto?

Error: referencia de elemento obsoleto: el elemento no está adjunto al documento de la página después de regresar una página

Beautiful Soup y el método find_all no enumeran todas las etiquetas en el archivo de texto.

Optimizar el web scraping con Rselenium