es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Extracción de tablas mediante R rvest, la celda inferior derecha que comienza con “<=" se devuelve como NA lógico.

Estoy tratando de extraer una tabla web que contiene una celda que comienza con “<=”. Esta celda (la celda inferior derecha) se devuelve como un valor lógico NA. Si cambio “<=” por “>=”, este valor se extrae sin problema. Tengo este problema con rvest 1.02 en RStudio Workbench, pero no tengo problema en la versión de RStudio de mi computadora portátil que ejecuta rvest 1.00.

# Ejemplo mínimo:

sample <- 
  minimal_html("<table>
               <tbody>
               <tr>
               <th>Col A</th><th>Col B</th>
               </tr>
               <tr>
               <td>>=62.000</td><td><=72.000</td>
               </tr>
               </tbody>
               </table>")
sample %>% 
  rvest::html_elements("table") %>% 
  rvest::html_table()

Salida:

[[1]]

A tibble: 1 × 2

Col A Col B

1 >=62.000 NA
“`

Tags:  ,

Answer

  1. Avatar for davy.ai

    El problema al extraer una tabla web que contiene una celda con “<=” utilizando rvest 1.02 en RStudio Workbench pero no en RStudio 1.00 se puede resolver actualizando el paquete rvest a la última versión. El valor lógico NA en la celda inferior derecha es el resultado de un error que fue solucionado en una versión posterior del paquete. Esto puede ser confirmado ejecutando el mismo código en una versión posterior de rvest, lo cual debería retornar el valor correcto en la celda inferior derecha.

    “`{r}
    library(rvest)
    sample <- minimal_html("

    Col A Col B
    >=62.000 <=72.000

    “)
    sample %>%
    html_elements(“table”) %>%
    html_table()


    Resultado:

    [[1]]

    A tibble: 1 x 2

    Col A Col B

    1 >=62.000 <=72.000
    “`

    La actualización del paquete se puede hacer ejecutando install.packages("rvest").

Comments are closed.