Tag: WEB-SCRAPING
Estoy teniendo problemas para extraer una tabla con python. El ejemplo es la tabla grande en un sitio web de historial meteorológico con todos los números cada hora. url= “https://www.wunderground.com/history/daily/us/va/arlington-county/KDCA/date/2019-1-25” page = requests.get(url) soup = BeautifulSoup(page.text, “html.parser”) my_table = soup.find(“table”, class_ = “mat-table cdk-table mat-sort ng-star-inserted”) print(my_table) Obtuve el atributo . . . Read more
Desde esta página web https://www.norgren.com/de/en/list estoy tratando de obtener ese tipo de enlace donde se encuentran diferentes productos. Hay 6 categorías que tienen un botón “Más información” que, al recorrer de forma recursiva, generalmente llego a las páginas objetivo. Esta es una página de listado de productos https://www.norgren.com/de/en/list/directional-control-valves/in-line-and-manifold-valves que deseo . . . Read more
Actualmente estoy tratando de recopilar datos financieros históricos de BitCoin de Yahoo Finance, mientras todavía puedo elegir cuándo quiero comenzar a minar los datos. Mi código es el siguiente, sin embargo, aparece un error diciéndome “HTTP Error 404: Not Found” … ¿Puedes decirme de dónde proviene este error y cómo . . . Read more
Estoy tratando de extraer todos los datos de precios de este sitio https://www.bynogame.com/tr/oyunlar/knight-online/gold-bar utilizando Puppeteer. Puedo extraer los precios uno por uno, pero no puedo obtener todos los elementos p, se devuelve null como resultado. Aquí está mi código que funciona para extraer uno por uno, y el código a . . . Read more
Espero obtener un contador de cuántas veces aparece una palabra específica en una URL dada. Actualmente tengo una manera de hacer esto para un pequeño conjunto de URL y una sola palabra: import requests from bs4 import BeautifulSoup url_list = [“https://www.example.org/”,”https://www.example.com/”] # la_palabra = input() la_palabra = ‘Python’ total_palabras = . . . Read more