Tag: URLLIB
Estoy intentando leer un archivo csv.gz en Python, leo el archivo con urllib.request.open(), luego tuve dos problemas, el primero es que el archivo está en bytes y necesito que esté en [tag:utf-8] para poder usar pandas, el segundo problema es que no entiendo precisamente cómo puedo leer este tipo de . . . Read more
Estoy tratando de ejecutar un script en python3 (he intentado con 3.7.4 y 3.8.0) el cual usa urllib.request y urllib.error. He intentado importar de las siguientes maneras: import urllib y from urllib import request pero en ambos casos obtengo el error: AttributeError: el módulo ‘urllib’ no tiene el atributo ‘request’ . . . Read more
Así que estaba intentando esto para una sola imagen. import urllib.request urllib.request.urlretrieve("link.com","name1.jpg") y descubrí que el enlace de las imágenes es constante y solo un dígito es variable. El primer enlace: https://image.slidesharecdn.com/marketinginternationalsept2013-150330215818-conversion-gate01/95/marketing-international-1-638.jpg?cb=1427770871 El último enlace: https://image.slidesharecdn.com/marketinginternationalsept2013-150330215818-conversion-gate01/95/marketing-international-92-638.jpg?cb=1427770871 donde solo el número 1 al 92 es variable. Estoy atascado en hacer una . . . Read more
Hay un sitio web del cual me gustaría extraer un enlace específico. Logré hacerlo solamente para un sitio. Hay 133 sitios, de los cuales necesito los enlaces. ¿Podrías por favor aconsejarme cómo hacerlo? Hasta ahora pude construir esto. Entiendo que debería utilizar de alguna forma el arreglo “pages”, pero no . . . Read more
Estoy intentando hacer web scraping en este sitio web dinámico para obtener los nombres de los cursos y los horarios de las clases ofrecidos durante un semestre: https://www.utsc.utoronto.ca/registrar/timetable El problema es que cuando ingresas al sitio web por primera vez, aún no se muestran los cursos, solo después de seleccionar . . . Read more