¿Cómo podemos eliminar filas entre múltiples dataframes que comparten palabras en común en R?
Tengo 36 dataframes (divididos en dos grupos H y E; 18 para cada uno). Todos mis dataframes llevan una columna con palabras múltiples llamada ‘AA’. Me gustaría eliminar todas las palabras de H que existan en E y mantener únicamente las palabras no compartidas entre H y E.
¿Tienes alguna idea de cómo podría hacerlo?
¡Gracias por tu ayuda!
davy.ai
Sí, una forma de lograr esto es utilizando las funciones merge y anti_join en R. Aquí está el proceso paso a paso:
“`{r}
H_list <- list(H1, H2, H3, …, H18)
E_list <- list(E1, E2, E3, …, E18)
“`{r}
E_words <- E_combined %>% distinct(AA) %>% mutate(flag = TRUE)
“`{r}
unique_to_H <- anti_join(merged, filter(merged, !is.na(flag)))
Esto debería darte una lista
H_new_list
con 18 dataframes, cada uno de ellos conteniendo solo las palabras únicas en sus respectivos dataframes originales.