Tag: DATA-HARVEST

¿Cómo puedo extraer esta tabla específica de esta página web usando R?

31 Jul, 2023 Programación 0

Estoy intentando extraer una tabla de una página web específica, pero no estoy obteniendo resultados con mis códigos. Mis códigos son los siguientes: library(rvest) library(dplyr) url1 <- “https://finance.yahoo.com/quote/SKLZ/cash-flow?p=SKLZ” url_page <- read_html(url1) listings <- html_nodes(url_page, css = ‘.Pos’) La tabla que me interesa extraer se encuentra dentro de <div class=”Pos(r)” data-reactid=”33″> . . . Read more

¿Cómo podemos extraer los valores faltantes de IMDB en R?

28 Jul, 2023 Programación 0

biblioteca(rvest) imdb_pagina <- read_html(“https://www.imdb.com/search/title/?titletype=feature&releasedate=2018-01-01,2019-12-31&countries=us&sort=alpha,asc&ref=adv_prv”) titulo <- imdb_pagina %>% html_nodes(“.lister-item-header a”) %>% html_text() calificacion <- imdb_pagina %>% html_nodes(“.ratings-imdb-rating strong”) %>% html_text() peliculas <- data.frame(titulo) peliculas2 <- data.frame(calificacion) Básicamente, el código anterior se utiliza para extraer los títulos y las calificaciones de 50 películas. También se desea que los valores faltantes se . . . Read more

Creación de un bucle de webscraping en R.

28 Jul, 2023 Programación 0

Estoy intentando configurar un bucle de extracción de datos web en R, pero estoy realmente luchando para crear un bucle que funcione. Actualmente tengo un archivo de Excel que contiene las URL relevantes que me gustaría extraer. Leo esto en R e intento usar una herramienta de extracción web para . . . Read more

Expresión regular que contiene símbolos tanto latinos como cirílicos.

25 Jul, 2023 Programación 0

Tengo la cadena obtenida de html_text() feel sore — бoléte feel sore about — sufrir; padecer Pero debería ser así feel sore — boléte feelsore about — sufrir; padecer El problema es que rvest no distingue los espacios en blanco de los saltos de línea, pero necesito obtener únicamente la primera línea ” feel sore — boléte” de alguna manera. . . . Read more

rvest es una biblioteca de R que se utiliza para extraer información de páginas web. Una de sus funciones clave es la capacidad de raspar (scrape) datos de un iframe dentro de una página web reactiva. También permite raspar una tabla específica dentro de ese iframe.

22 Jul, 2023 Programación 0

Estoy tratando de extraer datos (todos los países y años) de una tabla dentro de un sitio web en un iframe. Algunos códigos que he intentado están abajo. Después de leer varios mensajes aquí, logré obtener la dirección real del sitio web de la tabla dentro del iframe: https://apps7.unep.org/contribution/. He . . . Read more

1 2 … 6

es.davy.ai

¿Tienes una pregunta?