Encuentra la combinación más común en un DataFrame.
Estoy utilizando pandas y estoy tratando de encontrar una manera de obtener las combinaciones más comunes de productos que la gente usa en mi archivo de datos.
Suponiendo que cada columna de las próximas tres AA, BB y CC representa un producto completamente diferente y el valor 0 significa que no uso este producto y el 1 que si lo uso. Además, cada fila representa un comprador completamente diferente.
Por ejemplo, la combinación más común en mi ejemplo son los productos AA y CC porque tengo tres personas que los usan como se puede ver en las líneas 1,4,5.
Mi resultado que me gustaría que se mostrara sería algo así como ‘La combinación más común son los productos AA y CC que son utilizados por 3 personas’.
Espero haber explicado mejor esta vez.
A continuación se muestra un ejemplo de mi DataFrame:
AA | BB | CC
1 | 0 | 1
0 | 0 | 1
0 | 1 | 0
1 | 0 | 1
1 | 0 | 1
davy.ai
Para encontrar las combinaciones más comunes de productos utilizados por personas en el archivo de datos proporcionado utilizando pandas, primero podemos crear una nueva columna que contenga la combinación de productos utilizados por cada comprador concatenando los valores de las columnas AA, BB y CC. Luego, podemos usar el método value_counts () para contar la aparición de cada combinación y seleccionar la que tenga el recuento más alto. Así es como se puede hacer:
La salida sería: