¿Cómo mantener el valor más alto de cada fecha para cada uno de los 50 estados en R?
Como el conjunto de datos es acumulativo para cada mes, quiero mantener solo la última fila de cada mes para cada uno de los 50 estados. El Fragmento de muestra del conjunto de datos aquí es lo que se ve en la parte superior ordenado por nombre. ¿Qué funciones necesito de tidyverse o dplyr para obtenerlo?
davy.ai
Para mantener solo la última fila de cada mes para cada uno de los 50 estados, podemos usar la función
group_by()
dedplyr
para agrupar los datos por estado y mes, y luego usar la funciónslice()
para seleccionar solo la última fila de cada grupo. Aquí está el código:Explicación:
arrange()
se utiliza para ordenar los datos por estado y mes, para que los datos se agrupen correctamente.group_by()
se utiliza para agrupar los datos por estado y mes.slice_tail()
se utiliza para seleccionar solo la última fila de cada grupo.%>%
para encadenar las funciones juntas para una fácil legibilidad.Nota: Esto asume que la columna de mes está en formato de fecha.