Tag: BEAUTIFULSOUP
Hice este código para extraer letras de una página web, informando el artista y el nombre de la música. El código funciona, el problema es que tengo un DataFrame (llamado years19202020) con 10000 músicas, y tardó 1:30h en recuperar todas estas letras. ¿Hay alguna manera de hacerlo más rápido? def . . . Read more
Digamos que quiero hacer scraping en IMDb para obtener las 10 películas más populares. Me gustaría obtener el título de las películas y los miembros del reparto de las mismas. Puedo fácilmente obtener el título de las películas y agregarlos a una lista. El problema es que no sé cómo . . . Read more
Estoy intentando hacer web scraping en Github Este es el código: import requests as req from bs4 import BeautifulSoup</p> <p>urls = [ “https://github.com/moom825/Discord-RAT”, “https://github.com/freyacodes/Lavalink”, “https://github.com/KagChi/lavalink-railways”, “https://github.com/KagChi/lavalink-repl”, “https://github.com/Devoxin/Lavalink.py”, “https://github.com/karyeet/heroku-lavalink”]</p> <p>r = req.get(urls[0])</p> <p>soup = BeautifulSoup(r.content,”lxml”)</p> <p>title = str(soup.find(“p”,attrs={“class”:”f4 mt-3″}).text) print(title) Cuando ejecuto el programa no recibo ningún tipo de error pero . . . Read more
Estoy intentando extraer el precio de: https://store.steampowered.com/search/?filter=topsellers&snr=1_241_4_action_12 Estoy utilizando: soup.find_all('div',{'class':'col search_price responsive_secondrow'}) Sin embargo, hay precios con descuento, los cuales no están presentes en la clase div anterior, en cambio, se pueden encontrar usando: soup.find_all('div',{'class':'col search_price discounted responsive_secondrow'}) He extraído los títulos de los juegos y quiero que los precios . . . Read more
Eres un traductor de español que traduce documentos de TI. Traduce lo siguiente al español. No traduzcas el código y la salida en markdown from selenium import webdriver from selenium.webdriver.firefox.options import Options options = Options() options.binary_location = r'C:\Program Files\Mozilla Firefox\firefox.exe' driver = webdriver.Firefox(executable_path=r'C:\Users\******\Downloads\geckodriver.exe', options=options) #driver.get('http://google.com/') url = "https://www.foxnews.com/sports/nfl-great-frank-gore-says-hall-of-famer-numbers-speak-themselves" driver.get(url) item . . . Read more