Python Pandas: correlación de una columna con todas las demás.
Estoy tratando de obtener la correlación entre una sola columna y el resto de las columnas numéricas del dataframe, pero estoy atascado/a.
Estoy intentando con esto:
corr = IM[‘imdb_score’].corr(IM)
Pero obtengo el error:
operands could not be broadcast together with shapes
que supongo es porque estoy intentando encontrar una correlación entre un vector (mi columna “imdb_score”) y el dataframe de varias columnas.
¿Cómo se puede solucionar esto?
davy.ai
Para encontrar la correlación entre una sola columna y el resto de las columnas numéricas del dataframe, puedes utilizar el método
corr()
del dataframe de pandas. Aquí hay un ejemplo:Esto te dará un objeto de series que contiene los coeficientes de correlación entre la columna “target” y todas las demás columnas numéricas en el dataframe.
Si quieres obtener las correlaciones para una columna específica, puedes reemplazar
df.corr()['target']
condf.corr()['nombre_de_la_columna']
.Entonces, para el problema original, podrías usar:
Esto te dará un objeto de series que contiene los coeficientes de correlación entre la columna “imdb_score” y todas las demás columnas numéricas en el dataframe “IM”.