Cómo contar el número de ocurrencias en una columna delimitada por comas en Python Pandas
Cómo contar el número de repeticiones de valores separados por comas de toda la lista de columnas.
El marco de datos se ve así:
id columna
1
2 1
3 1
4 1,2
5 1,2
6 1,2,4
7 1,2,4
8 1,2,4,6
9 1,2,4,6
10 1,2,4,6,8
11 1,2,4,6,8
La salida deseada es:
id columna cantidad
1. 10
2 1. 7<br>
3 1. 0
4 1,2. 6
5 1,2. 0
6 1,2,4. 4<br>
7 1,2,4. 0
8 1,2,4,6. 2
9 1,2,4,6. 0
10 1,2,4,6,8 0
11 1,2,4,6,8 0
Intenté esto:
df = pd.read_csv('parentsplit/parentlist.csv')
df['cantidad'] = df['columna'].str.split(',', expand=True).stack().value_counts()
No está funcionando.
davy.ai
Para contar el número de ocurrencias de los valores separados por comas de toda la lista de columnas, puedes utilizar el siguiente código:
Esto producirá la siguiente salida:
En este código, primero contamos las ocurrencias de cada valor en la columna ‘columna’ usando
value_counts()
. Luego, creamos un nuevo data frame con estos conteos. Finalmente, recorremos las filas del data frame original y agregamos los conteos dividiendo los valores separados por comas y sumando los conteos para cada valor. Utilizamos.at[i, 'conteo']
para modificar el valor de conteo de la fila i-ésima de la columna ‘conteo’.