es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: APIFY

Cómo compartir cookies entre múltiples ejecuciones de Apify SDK crawlers 1. En primer lugar, asegúrese de tener instalado el Apify SDK en su entorno de desarrollo. 2. Una vez que tenga el SDK instalado, abra el script del crawler que desea configurar para compartir cookies. 3. Dentro del script, asegúrese de tener la siguiente importación al comienzo del archivo: “`javascript const Apify = require(‘apify’); “` 4. A continuación, agregue el siguiente fragmento de código para utilizar el almacén de cookies compartido entre ejecuciones: “`javascript const { utils: { puppeteer } } = Apify; Apify.main(async () => { // Configuración del almacenamiento de cookies compartido const cookieJar = await Apify.openCookieJar(); // Inicialización del crawler const crawler = new Apify.PuppeteerCrawler({ cookieJar, // Resto de la configuración del crawler }); // Ejecutar el crawler await crawler.run(); }); “` 5. Con el código anterior, el Apify SDK configurará automáticamente un almacenamiento de cookies compartido entre cada ejecución del crawler, lo que le permitirá compartir cookies entre runs. 6. Asegúrese de que su crawler esté utilizando instancias de `PuppeteerCrawler` y configure `cookieJar` usando el objeto del almacenamiento de cookies compartido. Con estos pasos, habrá configurado correctamente el compartir cookies entre múltiples ejecuciones de Apify SDK crawlers.

Con Apify, estoy intentando extraer resultados de búsqueda de un sitio que requiere iniciar sesión: 1. Obtener la página de inicio de sesión para obtener el token de inicio de sesión (es un campo oculto en el formulario de inicio de sesión). 2. Hacer una solicitud que simule el inicio . . . Read more

Cómo acceder a las opciones de inicio de Playwright

Soy nuevo en Apify. Seguí esta guía y tuve éxito en todo: https://docs.apify.com/crawling-basics/headless-browser#headless-env-var Pero no entiendo qué debo hacer para “acceder a las opciones de lanzamiento de Playwright” como se menciona en el siguiente enlace, en la sección “Código de scraping”. Entonces no entiendo dónde puedo encontrar esto: “En el . . . Read more

El cargador continuo de PlaywrightCrawler no activa handlePageFunction.

Tengo un PlaywrightCrawler para raspar Alibaba. Pero cuando agrego una solicitud a una página como: https://www.alibaba.com/product-detail/Mono-filament-12-mm-PP-fiber1600139352513.html?spm=a27aq.industrycategoryproductlist.dt3.1.3d733642TkHgZc Esta página sigue cargando hasta que ocurre un tiempo de espera y no se llama a handlePageFunction. En realidad, todo el contenido se ha cargado por completo. Me doy cuenta de que algunos AJAX . . . Read more