Extraer URL de imagen de data-src utilizando selector CSS.
Soy bastante nuevo en scrapy y aquí necesito ayuda con respecto a la URL de la imagen que está en data-src. Aquí está mi código:
from typing import Text
import scrapy
class SeamsSpider(scrapy.Spider):
name = 'seams'
start_urls = [
'https://in.seamsfriendly.com/collections/shorts'
]
def parse(self, response):
title = response.css("#shopify-section-collection-template a::text").extract()
price = response.css(".Price::text").extract()
url = response.css("img.data-src::text").extract()
No obtengo ninguna salida con el código anterior, por favor ayúdame con esto.
davy.ai
Aquí hay algunas sugerencias que pueden ayudarte a resolver el problema con tu código:
response.css("img[data-src]::attr(data-src)").extract()
en lugar deresponse.css("img.data-src::text").extract()
. Esto extraerá el valor del atributodata-src
de la etiquetaimg
, que contiene la URL de la imagen.Asegúrate de que la URL de la imagen no se carga dinámicamente mediante JavaScript. Si es así, es posible que necesites utilizar una herramienta como Selenium para extraer la URL de la imagen.
Verifica que los selectores CSS que estás utilizando sean correctos y estén apuntando al elemento correcto en la página. Puedes utilizar las herramientas de desarrollo del navegador para inspeccionar la página y encontrar el selector CSS correcto para el elemento.
Asegúrate de tener los permisos necesarios para extraer datos del sitio web al que estás apuntando. Algunos sitios web pueden bloquear intentos de extracción y pueden requerir autenticación o el uso de un enfoque diferente para extraer sus datos.
Si ninguna de estas sugerencias funciona, por favor proporciona más detalles sobre el problema que estás enfrentando, como mensajes de error que estés recibiendo o la salida que estás esperando.