Necesito un ejemplo de cómo sacar información de este sitio.

davy.ai

May 28, 2023 at 3:37 pm

Para raspar un solo valor del sitio web dado, debe identificar el elemento HTML que contiene ese valor y extraer su texto. En este caso, el elemento en el que estamos interesados es el div con clase "SentimentValueLong".

Así es como puede hacerlo usando rvest:

`{r} biblioteca(rvest) url <- "https://www.fxblue.com/market-data/tools/sentiment" web <- read_html(url) nodo <- html_node(web, ".SentimentValueLong") valor <- html_text(nodo) valor `

Explicación:

Primero, cargamos el paquete rvest y especificamos la URL que queremos raspar.
A continuación, leemos el contenido HTML de la página web utilizando read_html() y lo guardamos en el objeto web.
Luego, utilizamos la función html_node() para extraer el primer nodo HTML que coincide con el selector .SentimentValueLong.
Finalmente, utilizamos html_text() para extraer el contenido de texto del nodo div y lo guardamos en la variable valor.

Si desea utilizar RSelenium para raspar el sitio web, puede seguir el mismo enfoque pero automatizar la navegación web utilizando un controlador web. Así es como:

`{r} biblioteca(RSelenium) rD <- rsDriver(browser="chrome", verbose = FALSE) remDr <- rD[["client"]] remDr$maxWindowSize() remDr$navegar("https://www.fxblue.com/market-data/tools/sentiment") Sys.sleep(5) # Espere a que se cargue la página html <- remDr$getPageSource()[[1]] página <- read_html(html) nodo <- html_node(página, ".SentimentValueLong") valor <- html_text(nodo) valor `

Explicación:

Primero, cargamos el paquete RSelenium y comenzamos un controlador de Chrome utilizando rsDriver().
Luego, navegamos a la URL utilizando el método remDr$navegar() y esperamos unos segundos a que la página se cargue completamente usando Sys.sleep().
A continuación, extraemos el contenido HTML de la página utilizando el método remDr$getPageSource() y lo guardamos en el objeto html.
Luego, leemos el contenido HTML utilizando read_html() y lo guardamos en el objeto página.
Utilizando la función html_node(), extraemos el primer nodo HTML que coincide con el selector .SentimentValueLong y lo guardamos en la variable nodo.
Finalmente, extraemos el contenido de texto del nodo div utilizando html_text() y lo guardamos en la variable valor.

Answer

davy.ai

May 28, 2023 at 3:37 pm
Para raspar un solo valor del sitio web dado, debe identificar el elemento HTML que contiene ese valor y extraer su texto. En este caso, el elemento en el que estamos interesados es el div con clase "SentimentValueLong".

Así es como puede hacerlo usando rvest:

`{r} biblioteca(rvest) url <- "https://www.fxblue.com/market-data/tools/sentiment" web <- read_html(url) nodo <- html_node(web, ".SentimentValueLong") valor <- html_text(nodo) valor `

Explicación:
- Primero, cargamos el paquete rvest y especificamos la URL que queremos raspar.
- A continuación, leemos el contenido HTML de la página web utilizando read_html() y lo guardamos en el objeto web.
- Luego, utilizamos la función html_node() para extraer el primer nodo HTML que coincide con el selector .SentimentValueLong.
- Finalmente, utilizamos html_text() para extraer el contenido de texto del nodo div y lo guardamos en la variable valor.
Si desea utilizar RSelenium para raspar el sitio web, puede seguir el mismo enfoque pero automatizar la navegación web utilizando un controlador web. Así es como:

`{r} biblioteca(RSelenium) rD <- rsDriver(browser="chrome", verbose = FALSE) remDr <- rD[["client"]] remDr$maxWindowSize() remDr$navegar("https://www.fxblue.com/market-data/tools/sentiment") Sys.sleep(5) # Espere a que se cargue la página html <- remDr$getPageSource()[[1]] página <- read_html(html) nodo <- html_node(página, ".SentimentValueLong") valor <- html_text(nodo) valor `

Explicación:
- Primero, cargamos el paquete RSelenium y comenzamos un controlador de Chrome utilizando rsDriver().
- Luego, navegamos a la URL utilizando el método remDr$navegar() y esperamos unos segundos a que la página se cargue completamente usando Sys.sleep().
- A continuación, extraemos el contenido HTML de la página utilizando el método remDr$getPageSource() y lo guardamos en el objeto html.
- Luego, leemos el contenido HTML utilizando read_html() y lo guardamos en el objeto página.
- Utilizando la función html_node(), extraemos el primer nodo HTML que coincide con el selector .SentimentValueLong y lo guardamos en la variable nodo.
- Finalmente, extraemos el contenido de texto del nodo div utilizando html_text() y lo guardamos en la variable valor.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Necesito un ejemplo de cómo sacar información de este sitio.

Answer

davy.ai