Tag: BEAUTIFULSOUP
No pude encontrar el valor. La ubicación del valor en HTML es (span 161/span). ¿Debería intentar el método xpath para obtener el elemento? ¿O tiene alguna sugerencia mejor? !pip install Selenium from selenium import webdriver Debe colocar chromedriver en la misma carpeta browser = webdriver.Chrome(executable_path=’./chromedriver.exe’) browser.get(“https://shopee.tw/shop/10228173/search?page=0&sortBy=ctime”) source = browser.page_source import . . . Read more
He estado intentando raspar el código de Zillow, pero BeautifulSoup devuelve mucho menos código que el “view-source” de Chrome. Aquí está mi código: from bs4 import BeautifulSoup import requests url=’https://www.zillow.com/homedetails/49-Mountain-St-Hartford-CT-06106/58139903_zpid/’ html=requests.get(url) bs = BeautifulSoup(html.text,”html.parser”) bs Los resultados muestran que el contenido en el cuerpo es muy limitado. Sin embargo, si . . . Read more
Estoy trabajando en un proyecto de web scraping. Mi objetivo es hacer un raspado web del ranking de la Universidad de Shanghai para obtener el nombre, el país y el rango. Actualmente solo me estoy enfocando en el nombre. import requests <p>from bs4 import BeautifulSoup</p> <p>arwu = open(‘arwu.txt’, ‘a’) arwu.truncate() . . . Read more
Hola, he estado intentando todo el día encontrar una manera de descargar algunas imágenes de esta URL: https://omgcheckitout.com/these-trypophobia-photos-will pero cuando corro este código, siempre obtengo solo las URLs de las imágenes pequeñas en la esquina y no las encontradas en el artículo. (También he intentado otras maneras pero siempre obtengo . . . Read more
Estoy obteniendo todas las ocurrencias de una etiqueta específica (td) con la función “find_all()”, pero quiero manejar diferentes clases. Mis etiquetas se ven algo así: <td class=”classname” colspan=”2″> Algo… </td> Quiero hacer diferentes cosas dependiendo de la clase del nombre. Intenté usar “has_attr()” pero parece que solo verifica si hay . . . Read more