es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: BEAUTIFULSOUP

BeautifulSoup – cómo obtener elementos de un sitio web que no contienen div, como el resto de los elementos.

Estoy intentando raspar anuncios de trabajo desde el sitio web: https://www.jobs.bg/front_job_search.php?frompage=0&add_sh=1&categories%5B0%5D=29&location_sid=1&keywords%5B0%5D=python&term=#paging. Quiero obtener todos los datos visibles: título del trabajo, ubicación, descripción corta como: Full Stack; DBA, Big Data; Data Science, IA, ML y Embedded; Test, QA y la parte de raspar para esto es: result = requests.get(“https://www.jobs.bg/front_job_search.php?frompage=0&add_sh=1&categories%5B0%5D=29&location_sid=1&keywords%5B0%5D=python&term=#paging”).text soup = . . . Read more

Cómo extraer texto de diferentes ID con Beautiful Soup.

Quiero extraer el id pero cada id tiene un valor diferente, compruébalo: div',id='statement80863 div',id='statement26092 y así sucesivamente ………………………. CÓDIGO import requests from bs4 import BeautifulSoup import re limit = 100 url = f’https://www.counselingcalifornia.com/cc/cgi-bin/utilities.dll/customlist?FIRSTNAME=~&LASTNAME=~&ZIP=&DONORCLASSSTT=&_MULTIPLE_INSURANCE=&HASPHOTOFLG=&_MULTIPLE_EMPHASIS=&ETHNIC=&_MULTIPLE_LANGUAGE=ENG&QNAME=THERAPISTLIST&WMT=NONE&WNR=NONE&WHP=therapistHeader.htm&WBP=therapistList.htm&RANGE=1%2F{limit}&SORT=LASTNAME’ headers = {‘User-Agent’: ‘Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Mobile Safari/537.36’} . . . Read more