es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: BEAUTIFULSOUP

El bucle for en Python solo está devolviendo el primer elemento del índice.

Como dice el título, busqué en stackoverflow algunas preguntas similares, pero no pude encontrar la solución. Aquí están mis códigos r = requests.get(“http://cpaleaks.com”, headers={‘User-agent’: ‘Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:61.0) Gecko/20100101 Firefox/61.0’}) c = r.content soup = BeautifulSoup(c, “html.parser”) all = soup.find_all(“div”,{“id”:”content”}) all[0].find_all(“h2”)[0].text for item in all: print(item.find_all(“h2”)[0].text) Salida 6 . . . Read more

Cómo usar Beautifulsoup4

Necesito obtener un valor de mi archivo HTML, pero tengo algunas preguntas que no se responden en el tutorial de inicio rápido de Beautiful Soup. Lo que quiero hacer es extraer un número que fue ingresado por el usuario en mi sitio web y luego usar este número en una . . . Read more

Forma de poblar un archivo .csv con datos raspados en Python con pandas que sea más cercana a “print”

Logré raspar múltiples páginas y puedo imprimir mis resultados correctamente con: import requests from bs4 import BeautifulSoup import pandas as pd url = ‘https://www.marketresearch.com/search/results.asp?qtype=2&datepub=3&publisher=Technavio&categoryid=0&sortby=r’ def scrape_it(url): page = requests.get(url) soup = BeautifulSoup(page.text, ‘html.parser’) NextUrl = soup.find_all(class_=”standardLinkDkBlue”)[-1][‘href’] stri = soup.find_all(class_=”standardLinkDkBlue”)[-1].string html_text = requests.get(NextUrl).text reports = soup.find_all(‘tr’, class_=’SearchTableRowAlt’) for report in reports: . . . Read more