es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: BEAUTIFULSOUP

Crear filas y columnas en BeautifulSoup

A continuación se encuentra el código de Python y su resultado. Quiero que el resultado sea presentado en filas y columnas de un dataframe: response = requests.get(source_data) soup = BeautifulSoup(response.text, “html.parser”) States = soup.find_all(‘div’,class_ = ‘card bg-darker p-3 mb-3’) for item in States : state_name = item.find(class_=’fw-bold fs-5 mb-2′).text vaccinated_per . . . Read more

¿Cómo raspar uno de los span dentro de otra span class?

<span class=”jobs-status covid-icon clearfix”> <i class=”covid-home-icon”></i>Trabajo remoto </span> <span>Publicado hace algunos días</span> </span> Quiero extraer la última etiqueta span con el texto “Publicado hace algunos días”. Tengo el código pero solo está extrayendo el primer span con la clase. date_published=job.find(‘span’, class_=’sim-posted’).span.text

¿Cómo acceder a la siguiente página de este sitio web?

Hay un sitio web del cual me gustaría extraer un enlace específico. Logré hacerlo solamente para un sitio. Hay 133 sitios, de los cuales necesito los enlaces. ¿Podrías por favor aconsejarme cómo hacerlo? Hasta ahora pude construir esto. Entiendo que debería utilizar de alguna forma el arreglo “pages”, pero no . . . Read more

Raspado de DOI con BeautifulSoup

Actualmente estoy trabajando en un proyecto sobre extracción de datos de páginas web y necesito información de los registros de Google Scholar. Necesito extraer el DOI de un artículo y la página HTML correspondiente es así: <span data-v-d3a5356a=”” class=”metadata–doi”>DOI: <a data-v-d3a5356a=”” id=”article–doi–link-metadataSec” href=”//doi.org/10.1007/s00508-019-1485-6″>10.1007/s00508-019-1485-6</a> </span> <p><code> No puedo extraerlo con la función . . . Read more

¿Devuelve Beautiful Soup find_all() una lista ordenada?

Los datos devueltos por el método find_all() tienen una clase de bs4.element.ResultSet, y según mi investigación es una subclase de listas, por lo que asumo que es ordenada, pero aún así quiero preguntar para asegurarme de que mi suposición sea correcta, ya que soy un principiante en programación, no quiero . . . Read more