es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: BEAUTIFULSOUP

No se pudo obtener el número de teléfono y la dirección.

He recopilado el título y el enlace del sitio web, pero no puedo obtener el número de teléfono y la dirección. ¿Cómo puedo obtenerlos? Esto es lo que tengo: import re import requests from bs4 import BeautifulSoup url=’https://www.constructionplacements.com/top-construction-companies-in-india/’ req=requests.get(url) soup =BeautifulSoup(req.content,’lxml’) for h4 in soup.find_all(lambda tag: tag.name==’h4′ and re.search(r’^\d+.’,tag.text)): title=h4.text . . . Read more

Encuentre etiquetas en función de un valor de atributo con el número más alto.

Estoy tratando de encontrar una manera de encontrar la etiqueta <span> con el número más alto en el valor del atributo data-resolution. Esto es lo que he logrado hacer hasta ahora. from bs4 import BeautifulSoup html_doc = """ <span data-type="video-src" data-url="https://1080.com" data-resolution="1080"></span> <span data-type="video-src" data-url="https://720.com" data-resolution="720"></span> <span data-type="video-src" data-url="https://480.com" data-resolution="480"></span> . . . Read more

¿Cómo extraer sinopsis de IMDb en español?

Estoy tratando de extraer el título y la sinopsis de una película en español. Aunque ambos se muestran en español en el sitio web, después de extraer la página utilizando BeautifulSoup, obtengo el título en español pero la descripción de la película en inglés. Sé que existe una forma de . . . Read more

AttributeError: El objeto ‘function’ no tiene el atributo ‘replace’ con Tkinter y BeautifulSoup.

import tkinter as tk from tkinter import ttk import bs4 as bs from bs4 import BeautifulSoup, SoupStrainer import httplib2 soup = BeautifulSoup(‘html.parser’, features=’lxml’) h1>Creación del objeto Tkinter window = tk.Tk() <h1>Definición del tamaño del objeto</h1> window.title(“Python Tkinter Text Box”) window.minsize(300,200) label = ttk.Label(window, text = “Entrez l’URL”) label.grid(column = 0, . . . Read more

Error HTTP 403 al extraer enlaces completos de páginas web con urllib.request.urlopen(url)

Estoy tratando de descargar todos los enlaces completos de una lista de sitios web. El código es el siguiente: def get_links(url): html_page = urllib.request.urlopen(url) soup = BeautifulSoup(html_page) all_links = [url] for link in soup.find_all(‘a’): out=urljoin(url, link.get(‘href’)) if out not in all_links: all_links.append(out) return all_links Funciona bien para la mayoría de . . . Read more