es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: BEAUTIFULSOUP

Contar la frecuencia de una palabra específica en una URL específica – Python

Espero obtener un contador de cuántas veces aparece una palabra específica en una URL dada. Actualmente tengo una manera de hacer esto para un pequeño conjunto de URL y una sola palabra: import requests from bs4 import BeautifulSoup url_list = [“https://www.example.org/”,”https://www.example.com/”] # la_palabra = input() la_palabra = ‘Python’ total_palabras = . . . Read more

Raspado de sitios web – Cómo obtener parámetros de la clase div

Quiero extraer la información sobre el año, los kilómetros y el color de esta parte del código HTML utilizando BeautifulSoup de Python. ¿Alguien puede ayudarme? He intentado: res = requests.get(website) soup = BeautifulSoup(res.content, “html.parser”) results = soup.find(‘div’, {‘class’: ‘techParamsRow general’}) print(results) Pero no encuentra nada. ¡Gracias!

Obteniendo información mediante web scraping con bs dentro de las etiquetas span.

Estoy intentando obtener información desde un elemento span con un valor. <td class=”subtableheader”>Status</td> <td class=”profilerow”><span id=”status” value=”Levend (Offline for 0H 1M)”>Levend (Offline for <abbr title=”02-01-2022 22:53:24″>0H 1M</abbr>)</span> </td> Quiero obtener la siguiente información: Levend (Offline for <abbr title=”02-01-2022 22:53:24″>0H 1M</abbr>) Esto es dinámico y puede cambiar (offline durante 2 minutos, . . . Read more

Obteniendo información de forma aleatoria de un artículo de Wikipedia funciona para aproximadamente 1000 iteraciones con Beautiful Soup hasta que obtengo un error de atributo.

Código que he utilizado en un cuaderno de Jupyter: import requests from bs4 import BeautifulSoup corpus = “” for x in range(10000): URL = “https://en.wikipedia.org/wiki/Special:Random” page = requests.get(URL) html = page.text soup = BeautifulSoup(html) text = soup.p.text text = text.replace(‘[1]’, ”) text = text.replace(‘[2]’, ”) text = text.replace(‘[3]’, ”) text . . . Read more

¿Cómo puedo obtener el contenido dentro de window.data con Beautiful Soup y convertirlo en formato JSON para poder elegir qué clave y valor quiero imprimir?

No sabía cómo poner el título, así que es bastante largo. Siéntete libre de editarlo. Estoy intentando extraer datos de este sitio, pero no puedo descubrir cómo acceder a las claves y valores individuales dentro de ‘window.data’ con beautiful soup. Me gustaría, por ejemplo, obtener el valor de yyuid, birthday, . . . Read more