Tag: WEB-SCRAPING
He estado tratando de encontrar la tabla de este sitio web: https://consultas.anvisa.gov.br/#/medicamentos/25351532892201972/ Estoy utilizando el siguiente método: from bs4 import BeautifulSoup import requests url = “https://consultas.anvisa.gov.br/#/medicamentos/25351532892201972/” page = requests.get(url, verify=False) soup = BeautifulSoup(page.content, ‘html.parser’) print(soup.prettify()) for table in soup.find_all(‘table’): print(table) for subtable in table.find_all(‘table’): print(subtable) No muestra ningún resultado, porque . . . Read more
Intenté escribir un web scraper con la biblioteca Puppeteer. Funcionó correctamente en amazon.com, pero al intentarlo en otra página (coinhall.org) obtengo un error que no puedo resolver. ¿Alguien puede indicarme la dirección correcta aquí? const [el2] = await page.$x(‘//*[@id=”root”]/div/div[4]/div/div[1]/div[1]/div[2]/div[1]/div[2]/div[1]/div[1]’); const txt = await el2.getProperty(‘textContent’); const rawTxt = txt.jsonValue(); Error: const . . . Read more
Actualmente estoy creando un script en Python que ingresa a https://www.mwcbarcelona.com/exhibitors, hace clic en cada expositor y luego regresa a la misma página para hacer clic en el siguiente expositor. Este es el código que he escrito: from bs4 import BeautifulSoup import requests import csv import pandas as pd from . . . Read more
Estoy tratando de raspar un sitio web que he colocado en un archivo HTML local. Cuando uso el método find_all(), puedo obtener todo el texto de las etiquetas mostradas en los resultados de Python. El problema está en que no puedo hacer que se muestre todo el texto en un . . . Read more
Estoy haciendo web scraping en una página web dinámica y me gustaría optimizar el proceso ya que es muy lento. La página web muestra una serie de ventas con información y a medida que se desplaza hacia abajo, aparecen más ventas, aunque hay un número finito de ventas. Lo que . . . Read more