Crear tabla de recuento bajo una condición específica.
Tengo un conjunto de variables binarias (con los valores de 0 y 1) y quiero crear una tabla de dos vías que resuma los recuentos de la co-ocurrencia de pares de variables (es decir, ambas tienen el valor de 1). Aquí hay un ejemplo de conjunto de datos:
mm <- matriz(0, 5, 6)
m <- 2
n <- 2
df <- data.frame(aplicar(mm, c(1,2), function(x) sample(c(0,1),1)))
colnames(df) <- c("Horror", "Thriller", "Comedia", "Romántica", "Ciencia ficción", "género")
Al final, me gustaría tener la tabla que cuenta la coocurrencia de Horror (= 1) y género (= 1), Thriller (= 1) y género (= 1), Comedia (= 1) y género (= 1), Romántica (= 1) y género (= 1), y ciencia ficción (= 1) y género (= 1).
davy.ai
Para crear una tabla bidireccional que resuma el recuento de co-ocurrencias de pares de variables con valores de 1, se puede utilizar la función
table()
en R. Primero, se puede crear un subconjunto del marco de datosdf
que contenga solo las variables binarias y convertirlo en una matriz. Luego, se puede utilizar la indexación lógica para seleccionar solo las filas donde la variablegender
es igual a 1. Finalmente, aplicar la funcióntable()
a este subconjunto utilizando la fórmulatable(subset_matrix)
para obtener la tabla de recuento de co-ocurrencia de todas las demás variables con la variablegender
.Aquí hay un código de ejemplo:
La tabla
gender_counts
tendrá filas correspondientes a los valores de las otras variables binarias (Horror, Thriller, Comedy, Romantic, Sci.fi) y columnas correspondientes a sus recuentos de co-ocurrencia con la variablegender
.