Tag: BEAUTIFULSOUP
Este es mi HTML: ”’ html = “”” ‹ Countries Germany Frankfurt München “”” ”’ Dado que “country_selection” es el único elemento único que puedo seleccionar, ahora estoy intentando obtener los LIs con las ciudades (Frankfurt y München). Este es mi código: ”’ soup = BeautifulSoup(html) categories = soup.find(“span”, class_=”country_selection”) . . . Read more
Estoy tratando de escribir un raspador de YouTube y como parte de mi tarea necesito trabajar con varias clases en bs4. El HTML se ve así: <span id=”video-title” class=”style-scope ytd-playlist-panel-video-renderer”></span> Mi objetivo es usar el atributo “class” para obtener todas las 50 canciones diferentes y trabajar con ellas. Lo intenté . . . Read more
import requests as requests from bs4 import BeautifulSoup from tabulate import tabulate Cada vez que intento usar pyinstaller con este bloque de código, obtengo este error: 18919 INFO: Procesando el gancho de importación previa segura del módulo urllib3.packages.six.moves desde ‘C:\Users\DILRREET\AppData\Local\Programs\Python\Python310\lib\site-packages\PyInstaller\hooks\pre<em>safe</em>import_module\hook-urllib3.packages.six.moves.py’. IndexError: índice de tupla fuera de rango y cada vez . . . Read more
Estoy utilizando este código y funciona: from bs4 import BeautifulSoup import sys import requests page = requests.get(“https://finance.yahoo.com/quote/GOOGL?p=GOOGL”) soup = BeautifulSoup(page.content, ‘html.parser’) fin-streamer = soup.find(“fin-streamer”, class_=”Fz(36px)”) print(fin-streamer) print(fin-streamer.get_text()) Imprime lo siguiente para fin-streamer: <fin-streamer active=”” class=”Fw(b) Fz(36px) Mb(-4px) D(ib)” data-field=”regularMarketPrice” data-pricehint=”2″ data-reactid=”47″ data-symbol=”GOOGL” data-test=”qsp-price” data-trend=”none” value=”2897.04″>2,897.04</fin-streamer> Lo que me gustaría hacer . . . Read more
Intentando rastrear <https: edition.cnn.com/world=””> con Python utilizando el fragmento de código a continuación. El problema es que al usar BeautifulSoup para analizar el contenido, no obtengo todos los datos que quiero. Obtiene unos 20 elementos, pero hay muchos más elementos que deberían haber sido seleccionados. from requests_html import HTMLSession from . . . Read more