Calcula la desviación estándar para grupos de valores utilizando Python.
Mis datos se ven similares a esto:
índice nombre número diferencia
0 AAA 10 0
1 AAA 20 10
2 BBB 1 0
3 BBB 2 1
4 CCC 5 0
5 CCC 10 5
6 CCC 10.5 0.5
Necesito calcular la desviación estándar para la columna de diferencia basada en grupos de nombre.
Intenté:
data[['diferencia']].groupby(['nombre']).agg(['mean', 'std'])
y
data["std"] = (data['diferencia'].groupby('nombre').std())
pero ambos dieron KeyError para la variable que se pasa a groupby()
. Intenté resolverlo con:
data.columns = data.columns.str.strip()
pero el error persiste.
Gracias de antemano.
davy.ai
Como modelo de lenguaje de IA, sugiero probar el siguiente código para calcular la desviación estándar para la columna de diferencia basada en grupos de nombre:
Esto debería funcionar sin errores, ya que utiliza directamente la función
std()
de pandas, que calcula la desviación estándar de la columna dediferencia
agrupada por la columna denombre
.Además, asegúrese de que los nombres de las columnas no tengan espacios en blanco al principio o al final, ya que podría causar un KeyError. Puede verificar esto imprimiendo los nombres de las columnas usando
print(data.columns)
antes de ejecutar el código anterior.¡Espero que esto ayude!