Desplázate hacia abajo al final de una página web (selenium/python)

davy.ai

August 1, 2023 at 1:48 pm

Parece que la página web que estás intentando raspar tiene una galería cargada dinámicamente y las imágenes solo se cargan cuando se ven al hacer scroll. Para poder recuperar las 39 imágenes, deberás implementar el scroll en tu script.

Aquí tienes un enfoque que podrías intentar:

s = Service('D:\Selenium driver\chromedriver2.exe')
driver = webdriver.Chrome(service=s)
url = 'https://www.airbnb.com/rooms/43871809/photos?guests=1&adults=1'
driver.get(url)

# Obtén el conjunto inicial de imágenes
images = driver.find_elements_by_xpath('//div[@class="_1oaklsk"]/div/div/picture/img')

# Sigue haciendo scroll hasta que se carguen todas las imágenes
while len(images) < 39:
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
    time.sleep(2) # Espera a que se carguen las nuevas imágenes
    new_images = driver.find_elements_by_xpath('//div[@class="_1oaklsk"]/div/div/picture/img')
    if len(new_images) == len(images): # No se han cargado nuevas imágenes, salir del bucle
        break
    images = new_images

print(f"Se han obtenido {len(images)} imágenes.")

Este script primero obtiene el conjunto inicial de imágenes usando tu selector XPath existente. Luego, hace scroll repetidamente hasta el final de la página, esperando unos segundos para que se carguen nuevas imágenes y comprobando si se han añadido nuevas imágenes. Deja de hacer scroll una vez que se hayan obtenido las 39 imágenes o si no se han añadido nuevas imágenes después de hacer scroll.

Ten en cuenta que este no es el enfoque más eficiente, ya que implica hacer scroll repetidamente en toda la página incluso si solo se agregan algunas imágenes nuevas. Un enfoque más avanzado implicaría detectar cuando la última imagen de la galería está a la vista y luego hacer scroll solo una pequeña cantidad para cargar el siguiente conjunto de imágenes. Sin embargo, esto debería ser suficiente para tu tarea actual.

¡Buena suerte con tu web scraping!

Answer

davy.ai

August 1, 2023 at 1:48 pm
Parece que la página web que estás intentando raspar tiene una galería cargada dinámicamente y las imágenes solo se cargan cuando se ven al hacer scroll. Para poder recuperar las 39 imágenes, deberás implementar el scroll en tu script.

Aquí tienes un enfoque que podrías intentar:
```
s = Service('D:\Selenium driver\chromedriver2.exe')
driver = webdriver.Chrome(service=s)
url = 'https://www.airbnb.com/rooms/43871809/photos?guests=1&adults=1'
driver.get(url)

# Obtén el conjunto inicial de imágenes
images = driver.find_elements_by_xpath('//div[@class="_1oaklsk"]/div/div/picture/img')

# Sigue haciendo scroll hasta que se carguen todas las imágenes
while len(images) < 39:
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
    time.sleep(2) # Espera a que se carguen las nuevas imágenes
    new_images = driver.find_elements_by_xpath('//div[@class="_1oaklsk"]/div/div/picture/img')
    if len(new_images) == len(images): # No se han cargado nuevas imágenes, salir del bucle
        break
    images = new_images

print(f"Se han obtenido {len(images)} imágenes.")
```
Este script primero obtiene el conjunto inicial de imágenes usando tu selector XPath existente. Luego, hace scroll repetidamente hasta el final de la página, esperando unos segundos para que se carguen nuevas imágenes y comprobando si se han añadido nuevas imágenes. Deja de hacer scroll una vez que se hayan obtenido las 39 imágenes o si no se han añadido nuevas imágenes después de hacer scroll.

Ten en cuenta que este no es el enfoque más eficiente, ya que implica hacer scroll repetidamente en toda la página incluso si solo se agregan algunas imágenes nuevas. Un enfoque más avanzado implicaría detectar cuando la última imagen de la galería está a la vista y luego hacer scroll solo una pequeña cantidad para cargar el siguiente conjunto de imágenes. Sin embargo, esto debería ser suficiente para tu tarea actual.

¡Buena suerte con tu web scraping!

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Desplázate hacia abajo al final de una página web (selenium/python)

Answer

davy.ai