es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: WEB-SCRAPING

Cómo compartir cookies entre múltiples ejecuciones de Apify SDK crawlers 1. En primer lugar, asegúrese de tener instalado el Apify SDK en su entorno de desarrollo. 2. Una vez que tenga el SDK instalado, abra el script del crawler que desea configurar para compartir cookies. 3. Dentro del script, asegúrese de tener la siguiente importación al comienzo del archivo: “`javascript const Apify = require(‘apify’); “` 4. A continuación, agregue el siguiente fragmento de código para utilizar el almacén de cookies compartido entre ejecuciones: “`javascript const { utils: { puppeteer } } = Apify; Apify.main(async () => { // Configuración del almacenamiento de cookies compartido const cookieJar = await Apify.openCookieJar(); // Inicialización del crawler const crawler = new Apify.PuppeteerCrawler({ cookieJar, // Resto de la configuración del crawler }); // Ejecutar el crawler await crawler.run(); }); “` 5. Con el código anterior, el Apify SDK configurará automáticamente un almacenamiento de cookies compartido entre cada ejecución del crawler, lo que le permitirá compartir cookies entre runs. 6. Asegúrese de que su crawler esté utilizando instancias de `PuppeteerCrawler` y configure `cookieJar` usando el objeto del almacenamiento de cookies compartido. Con estos pasos, habrá configurado correctamente el compartir cookies entre múltiples ejecuciones de Apify SDK crawlers.

Con Apify, estoy intentando extraer resultados de búsqueda de un sitio que requiere iniciar sesión: 1. Obtener la página de inicio de sesión para obtener el token de inicio de sesión (es un campo oculto en el formulario de inicio de sesión). 2. Hacer una solicitud que simule el inicio . . . Read more

Cómo trabajar con múltiples clases utilizando BeautifulSoup & BS4

Estoy tratando de escribir un raspador de YouTube y como parte de mi tarea necesito trabajar con varias clases en bs4. El HTML se ve así: <span id=”video-title” class=”style-scope ytd-playlist-panel-video-renderer”></span> Mi objetivo es usar el atributo “class” para obtener todas las 50 canciones diferentes y trabajar con ellas. Lo intenté . . . Read more

Chromium/Chromedriver de repente dejó de mostrar correctamente los caracteres especiales al utilizar Selenium.

Estoy raspando https://fbref.com/en/squads/12192a4c/Greuther-Furth-Stats con Beautiful Soup y Selenium, lo cual funcionó bien hasta que de repente algunos caracteres especiales ya no se muestran correctamente. Aquí hay una captura de pantalla de cómo se muestra ahora: Estoy utilizando: – Chromium (Versión 96.0.4664.110 (Build oficial) para Linux Mint (64 bits)) – Chromedriver . . . Read more