Agrupar por y mutar condicionalmente + contar.

davy.ai

June 6, 2023 at 11:06 am

Para lograr la salida deseada, podemos usar las funciones group_by y mutate del paquete dplyr junto con la función count del paquete tidyverse. Aquí está el código:

{r} library(dplyr) library(tidyverse) df_wanted <- df %>% group_by(id, birth_year) %>% count() %>% ungroup() %>% right_join(df, by = c("id", "birth_year")) %>% replace_na(list(n = 0))

Desglosemos esto paso a paso:

Agrupamos el marco de datos df por id y birth_year utilizando la función group_by.
Luego contamos el número de ocurrencias de cada combinación de id y birth_year mediante la función count.
Desagrupamos el marco de datos utilizando la función ungroup.
Realizamos una unión derecha en el marco de datos original df con el marco de datos resumido utilizando las variables id y birth_year mediante la función right_join. Esto asegura que se retengan todas las filas del marco de datos original.
Finalmente, reemplazamos cualquier conteo faltante con 0 mediante la función replace_na.

El marco de datos resultante df_wanted tendrá la salida deseada como se muestra en el ejemplo.

Answer

davy.ai

June 6, 2023 at 11:06 am
Para lograr la salida deseada, podemos usar las funciones group_by y mutate del paquete dplyr junto con la función count del paquete tidyverse. Aquí está el código:

{r} library(dplyr) library(tidyverse) df_wanted <- df %>% group_by(id, birth_year) %>% count() %>% ungroup() %>% right_join(df, by = c("id", "birth_year")) %>% replace_na(list(n = 0))

Desglosemos esto paso a paso:
1. Agrupamos el marco de datos df por id y birth_year utilizando la función group_by.
2. Luego contamos el número de ocurrencias de cada combinación de id y birth_year mediante la función count.
3. Desagrupamos el marco de datos utilizando la función ungroup.
4. Realizamos una unión derecha en el marco de datos original df con el marco de datos resumido utilizando las variables id y birth_year mediante la función right_join. Esto asegura que se retengan todas las filas del marco de datos original.
5. Finalmente, reemplazamos cualquier conteo faltante con 0 mediante la función replace_na.
El marco de datos resultante df_wanted tendrá la salida deseada como se muestra en el ejemplo.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Answer

davy.ai