Tag: HTML-PARSING
Hay un sitio llamado y quiero obtener los paletas de colores que generan de forma programática. En el navegador, simplemente hago clic en el botón “¡Iniciar el generador!”. El enlace al que está adjunto el botón es . Si voy a esa URL en el navegador, se genera la paleta . . . Read more
Estoy intentando hacer web scraping de este sitio web: https://datausa.io/profile/university/cuny-city-college/ Mi código solo recupera la primera etiqueta div con la clase “tuition”, pero solo quiero recuperar el costo de alojamiento y comida. ¿Cómo puedo analizar una etiqueta específica? “`from bs4 import BeautifulSoup import requests url = requests.get('https://datausa.io/profile/university/cuny-city-college/') soup = BeautifulSoup(url.text, . . . Read more
Intentando analizar la tabla con el IDH y cargar los datos en un DataFrame de Pandas con las columnas: País, Puntuación del IDH. Estoy atascado cargando la columna de Nación con el siguiente código: import requests import pandas as pd from bs4 import BeautifulSoup html = requests.get(“https://en.wikipedia.org/wiki/List_of_countries_by_Human_Development_Index”) bsObj = BeautifulSoup(html.text, . . . Read more
La siguiente prueba unitaria falla: @Test public void test() throws Exception { String html = “<html><form id=\”myform\”></form></html>”; Document document = Jsoup.parse(html); Element inputElement = document.createElement(“input”); inputElement.attr(“name”, “any_name”); inputElement.attr(“value”, “any_value”); Element formElement = document.getElementById(“myform”); formElement = formElement.appendChild(inputElement); List<connection.keyval> formData = ((FormElement)formElement).formData(); Assert.assertEquals(1, formData.size()); } Preguntas: 1. ¿Es un error o estoy . . . Read more
Hay un sitio web donde necesito obtener los propietarios de este elemento de un ítem de juego en línea y a través de la investigación, necesito hacer un “web scraping” para obtener estos datos. Pero, la información se encuentra en un documento/código de Javascript, no en un documento HTML fácil . . . Read more