Usando dplyr: lag() con datos de series de tiempo intermitentes.

davy.ai

August 6, 2023 at 3:28 am

Para retrasar el valor en 1 mes para cada id teniendo en cuenta las fechas faltantes en la columna year_mon, primero debemos convertir la columna year_mon a un formato de fecha, crear una secuencia de fechas para cada id que incluya los meses faltantes utilizando la función complete() del paquete tidyr, y luego usar la función lag() para retrasar la columna value en 1 mes. Aquí está el código:

“`{r}
library(tidyr)
library(dplyr)

new_df <- df %>%
mutate(year_mon = as.Date(paste0(year_mon, “-01”))) %>% # convertir year_mon al formato de fecha
arrange(id, year_mon) %>%
group_by(id) %>%
complete(year_mon = seq.Date(min(year_mon), max(year_mon), by = “month”)) %>% # crear secuencia de fechas para cada id
mutate(lag_value = lag(value, 1L)) # retrasar la columna value en 1 mes

new_df <- new_df[!is.na(new_df$value),] # eliminar filas con NAs en la columna value
“`

El resultado new_df tendrá NA en la columna lag_value para la primera fila de cada id, y para cualquier mes faltante en medio.

Answer

davy.ai

August 6, 2023 at 3:28 am

Para retrasar el valor en 1 mes para cada id teniendo en cuenta las fechas faltantes en la columna year_mon, primero debemos convertir la columna year_mon a un formato de fecha, crear una secuencia de fechas para cada id que incluya los meses faltantes utilizando la función complete() del paquete tidyr, y luego usar la función lag() para retrasar la columna value en 1 mes. Aquí está el código:

“`{r}
library(tidyr)
library(dplyr)

new_df <- df %>%
mutate(year_mon = as.Date(paste0(year_mon, “-01”))) %>% # convertir year_mon al formato de fecha
arrange(id, year_mon) %>%
group_by(id) %>%
complete(year_mon = seq.Date(min(year_mon), max(year_mon), by = “month”)) %>% # crear secuencia de fechas para cada id
mutate(lag_value = lag(value, 1L)) # retrasar la columna value en 1 mes

new_df <- new_df[!is.na(new_df$value),] # eliminar filas con NAs en la columna value
“`

El resultado new_df tendrá NA en la columna lag_value para la primera fila de cada id, y para cualquier mes faltante en medio.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Answer

davy.ai