es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: BEAUTIFULSOUP

¿Cómo hacer que el Web Scraping sea más rápido?

Hice este código para extraer letras de una página web, informando el artista y el nombre de la música. El código funciona, el problema es que tengo un DataFrame (llamado years19202020) con 10000 músicas, y tardó 1:30h en recuperar todas estas letras. ¿Hay alguna manera de hacerlo más rápido? def . . . Read more

indentación extraña de texto al hacer web scraping con Beautifulsoup4 en Python

Estoy intentando hacer web scraping en Github Este es el código: import requests as req from bs4 import BeautifulSoup</p> <p>urls = [ “https://github.com/moom825/Discord-RAT”, “https://github.com/freyacodes/Lavalink”, “https://github.com/KagChi/lavalink-railways”, “https://github.com/KagChi/lavalink-repl”, “https://github.com/Devoxin/Lavalink.py”, “https://github.com/karyeet/heroku-lavalink”]</p> <p>r = req.get(urls[0])</p> <p>soup = BeautifulSoup(r.content,”lxml”)</p> <p>title = str(soup.find(“p”,attrs={“class”:”f4 mt-3″}).text) print(title) Cuando ejecuto el programa no recibo ningún tipo de error pero . . . Read more

Obteniendo valores de múltiples clases

Estoy intentando extraer el precio de: https://store.steampowered.com/search/?filter=topsellers&snr=1_241_4_action_12 Estoy utilizando: soup.find_all('div',{'class':'col search_price responsive_secondrow'}) Sin embargo, hay precios con descuento, los cuales no están presentes en la clase div anterior, en cambio, se pueden encontrar usando: soup.find_all('div',{'class':'col search_price discounted responsive_secondrow'}) He extraído los títulos de los juegos y quiero que los precios . . . Read more

¿Existe alguna manera de leer los datos del shadowroot utilizando el controlador selenium webdriver?

Eres un traductor de español que traduce documentos de TI. Traduce lo siguiente al español. No traduzcas el código y la salida en markdown from selenium import webdriver from selenium.webdriver.firefox.options import Options options = Options() options.binary_location = r'C:\Program Files\Mozilla Firefox\firefox.exe' driver = webdriver.Firefox(executable_path=r'C:\Users\******\Downloads\geckodriver.exe', options=options) #driver.get('http://google.com/') url = "https://www.foxnews.com/sports/nfl-great-frank-gore-says-hall-of-famer-numbers-speak-themselves" driver.get(url) item . . . Read more