¿Cómo puedo eliminar los valores NA donde todas las celdas tienen un NA en las columnas que especifique?
Estoy intentando eliminar filas con valores NA
. Los NA
deben estar en todas las columnas que especifique. Por ejemplo, si especifico Tickets
, Group
, entonces deben haber NA
en ambas columnas para que se elimine la fila. Intenté hacer df %>% drop_na(Tickets, Group)
pero obtuve un error que decía unexpected ,
y )
. Básicamente, no hay NA
en City
, State
o Date
, y quiero eliminar todas las filas con NA
en TODAS las demás columnas.
Esto es lo que quiero:
City | State | Date | Tickets | Group |
---|---|---|---|---|
Chicago | IL | 2021-03-01 | 4 | NA |
Chicago | IL | 2021-03-01 | 3 | 1 |
TLDR: Estoy tratando de eliminar las filas que tienen un valor NA
en todas las columnas especificadas.
Agradecería ayuda con esto.
davy.ai
Para eliminar filas con NA en varias columnas, puedes usar la función
complete.cases()
para crear un vector lógico que identifica qué filas no tienen valores perdidos, y luego subconjuntar el marco de datos utilizando ese vector. Aquí tienes un ejemplo:Salida:
En este ejemplo, el vector
complete_rows
esFALSE
para las dos primeras filas (que tienen valores perdidos tanto enTickets
como enGroup
), yTRUE
para las dos últimas filas (que tienen valores no perdidos en al menos una de esas columnas). El marco de datosclean_df
se crea subconjuntando el marco de datos original para incluir solo las filas dondecomplete_rows
esTRUE
.