Tag: BEAUTIFULSOUP
Estoy tratando de usar Scrapy para obtener el nombre del producto. Cuando he compilado el entorno de Scrapy y he intentado mi primer intento, falló. La salida muestra: KeyError: “no se encuentra la araña: yahoo” ¿Qué está mal en el código? Espero poder obtener algún consejo. Gracias. “` import scrapy . . . Read more
Como los nombres de clase están cambiando para cada elemento, me gustaría extraer la información basada en parte del nombre de la clase (carrier-text en el ejemplo). Sin embargo, no funciona… “` python html = “” Alaska Airlines 398 “”” soup = BeautifulSoup(html, ‘html.parser’) text = soup.find(‘div’,class_=”carrier-text”).text print(text)
Este era parte de otra pregunta (https://stackoverflow.com/questions/70128790/reading-urls-from-csv-and-appending-scrape-results-below-previous-with-python ) que fue generosamente respondida por @HedgeHog y contribuida por @QHarr. Ahora publico esta parte como una pregunta separada. En el código a continuación, pego 3 URLs de ejemplo en el código y funciona. Pero tengo una larga lista de URLs (1000+) para . . . Read more
Quiero extraer los valores del atributo “id” de una lista de filas de tabla como ésta: <tr id="8LVPCRJGR" role="row" class="odd">, mediante BeautifulSoup4. En el caso de esta etiqueta de ejemplo, quiero la parte “8LVPCRJGR”. Intenté este bloque de código (sí, importé los módulos bs4 y requests): url = “https://brawlify.com/stats/club/V8GVVR0R” result . . . Read more
Estoy intentando hacer un webscrapeo de este sitio https://www.edgeprop.sg/condo-apartment/aquarius-by-the-park para obtener el Tamaño del Terreno (sqm) en la tabla de visión general. El resultado debería ser 40,608. Sin embargo, no puedo obtener el resultado que quiero. Aquí está mi código: <h1>[Python] prueba de webscrapeo en edgeprop</h1> import gspread import json . . . Read more