es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: DATA-HARVEST

Aprendiendo el web scraping… necesito claridad sobre el xpath = “/html/body/div[3]/div[3]/div[4]/div/table[5] usando el plugin de XPath.

Estoy aprendiendo web scraping en R y entiendo el código HTML.. pero hay cierta confusión aquí… CÓDIGO 1: url <- “https://en.wikipedia.org/wiki/World_population” ten_most_df <- read_html(url) ten_most_populous % html_table() %>% .[[6]] CÓDIGO 2: url <- “https://en.wikipedia.org/wiki/World_population” ten_most_df <- read_html(url) ten_most_populous % html_nodes(xpath=”/html/body/div[3]/div[3]/div[4]/div/table[5]”) %>% html_table() ¿Los métodos utilizados en el código 1 y . . . Read more

Aprendiendo web scraping sin comprender: html_nodes(“table”) %>% `[[`(6) %>%

Estoy aprendiendo web scraping en r, escribí el siguiente código: url <- “https://en.wikipedia.org/wiki/World_population” library(rvest) library(tidyr) library(dplyr) ten_most_df <- read_html(url) ten_most_populous <- ten_most_df %>% html_nodes(“table”) %>% `[[`(6) %>% html_table() En el código mencionado anteriormente, ¿qué representa [[(6)`? También he consultado algunos documentos para esto, donde se escribe el siguiente texto, pero . . . Read more

R – Bucle para buscar y combinar páginas usando rvest

Me gustaría raspar los datos contenidos en tablas en varias páginas. Usé el código a continuación para raspar la primera tabla, pero no estoy seguro de cómo raspar las tablas en otras páginas: library(rvest) library(dplyr) WA_link <- “https://www.worldathletics.org/records/toplists/sprints/100-metres/outdoor/women/senior/2021?page=1” WA_page <- read_html(WA_link) WA_table <- WA_page %>% html_nodes(“table.records-table”) %>% html_table() %>% .[[1]] . . . Read more