Tag: DATA-HARVEST
Estoy intentando extraer una tabla de una página web específica, pero no estoy obteniendo resultados con mis códigos. Mis códigos son los siguientes: library(rvest) library(dplyr) url1 <- “https://finance.yahoo.com/quote/SKLZ/cash-flow?p=SKLZ” url_page <- read_html(url1) listings <- html_nodes(url_page, css = ‘.Pos’) La tabla que me interesa extraer se encuentra dentro de <div class=”Pos(r)” data-reactid=”33″> . . . Read more
biblioteca(rvest) imdb_pagina <- read_html(“https://www.imdb.com/search/title/?titletype=feature&releasedate=2018-01-01,2019-12-31&countries=us&sort=alpha,asc&ref=adv_prv”) titulo <- imdb_pagina %>% html_nodes(“.lister-item-header a”) %>% html_text() calificacion <- imdb_pagina %>% html_nodes(“.ratings-imdb-rating strong”) %>% html_text() peliculas <- data.frame(titulo) peliculas2 <- data.frame(calificacion) Básicamente, el código anterior se utiliza para extraer los títulos y las calificaciones de 50 películas. También se desea que los valores faltantes se . . . Read more
Estoy intentando configurar un bucle de extracción de datos web en R, pero estoy realmente luchando para crear un bucle que funcione. Actualmente tengo un archivo de Excel que contiene las URL relevantes que me gustaría extraer. Leo esto en R e intento usar una herramienta de extracción web para . . . Read more
Tengo la cadena obtenida de html_text() feel sore — бoléte feel sore about — sufrir; padecer Pero debería ser así feel sore — boléte feelsore about — sufrir; padecer El problema es que rvest no distingue los espacios en blanco de los saltos de línea, pero necesito obtener únicamente la primera línea ” feel sore — boléte” de alguna manera. . . . Read more
Estoy tratando de extraer datos (todos los países y años) de una tabla dentro de un sitio web en un iframe. Algunos códigos que he intentado están abajo. Después de leer varios mensajes aquí, logré obtener la dirección real del sitio web de la tabla dentro del iframe: https://apps7.unep.org/contribution/. He . . . Read more