Tag: BEAUTIFULSOUP
Estoy intentando obtener información de la etiqueta <a> que está entre estas dos etiquetas de span: <span class="mentioned"> <a class="mentioned-123" onclick="information('123');" href="#28669">>>28669</a> </span> Por ejemplo, me gustaría poder obtener el valor de href. ¿Cómo puedo hacer esto?
Tengo el siguiente código html que he extraído: <select class=”class1″ ,=”” id=”id1″> <option value=”0″>A1</option> <option value=”1″>A2</option> <option value=”2″>A3</option> <option value=”3″>A4</option> <option value=”4″>A5</option> <option value=”5″>A6</option> </select> . . . <select class=”class2″ ,=”” id=”id2″> <option value=”0″>B1</option> <option value=”1″>B2</option> <option value=”2″>B3</option> </select> . . <select class=”class3″ ,=”” id=”id3″> <option value=”0″>C1</option> <option value=”1″>C2</option> <option . . . Read more
He escrito un simple script para mí como práctica para encontrar quiénes han comprado las mismas pistas que yo en Bandcamp, con la idea de encontrar cuentas con gustos similares y así tener más música en común en sus cuentas. El problema es que la lista de fans en una . . . Read more
Estoy haciendo scraping de una página donde quiero devolver todas las cadenas de texto encontradas. Estoy utilizando Python. Mi código: import requests from bs4 import BeautifulSoup as bs doc = “https://www.kite.com/” res = requests.get(doc) soup = bs(res.content, “html.parser”) tag = soup.body for string in tag.strings: stringsOut = string print(stringsOut) Mi . . . Read more
Quiero tener un array urls[] para poder verificar y eliminar duplicados. Mi código actual se ve así: match2 = soup.find_all("a", href=True, target="_blank"); for match2 in match2: if match2['href'][0] == ".": imageUrl = url.split("/")[2] + "/" + url.split("/")[3] + "/src/" + match2['href'].split("/")[-1]; urls = []; urls.append(imageUrl); print("array"); for i in urls: . . . Read more