es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: BEAUTIFULSOUP

Extracción de ids y opciones de select utilizando BeautifulSoup y organizándolos en un dataframe de Pandas.

Tengo el siguiente código html que he extraído: <select class=”class1″ ,=”” id=”id1″> <option value=”0″>A1</option> <option value=”1″>A2</option> <option value=”2″>A3</option> <option value=”3″>A4</option> <option value=”4″>A5</option> <option value=”5″>A6</option> </select> . . . <select class=”class2″ ,=”” id=”id2″> <option value=”0″>B1</option> <option value=”1″>B2</option> <option value=”2″>B3</option> </select> . . <select class=”class3″ ,=”” id=”id3″> <option value=”0″>C1</option> <option value=”1″>C2</option> <option . . . Read more

Raspar la página HTML y devolver todas las cadenas donde su longitud es mayor a 8.

Estoy haciendo scraping de una página donde quiero devolver todas las cadenas de texto encontradas. Estoy utilizando Python. Mi código: import requests from bs4 import BeautifulSoup as bs doc = “https://www.kite.com/” res = requests.get(doc) soup = bs(res.content, “html.parser”) tag = soup.body for string in tag.strings: stringsOut = string print(stringsOut) Mi . . . Read more

¿Cómo puedo asignar el resultado de una solicitud de Beautiful Soup a un arreglo?

Quiero tener un array urls[] para poder verificar y eliminar duplicados. Mi código actual se ve así: match2 = soup.find_all("a", href=True, target="_blank"); for match2 in match2: if match2['href'][0] == ".": imageUrl = url.split("/")[2] + "/" + url.split("/")[3] + "/src/" + match2['href'].split("/")[-1]; urls = []; urls.append(imageUrl); print("array"); for i in urls: . . . Read more