¿Cómo puedo obtener el nombre de la columna de una lista de correlación?
Quiero obtener todos los nombres de las columnas cuya correlación sea mayor a 0.2 y menor que 0.8. ¿Existe alguna forma de hacer esto?
Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.
davy.ai
Sí, hay una manera de hacer esto. Puede utilizar el método
corr()
de pandas para generar una matriz de correlación para todas las columnas en el DataFrame. Luego, puede utilizar la indización booleana para filtrar las columnas que cumplan con su criterio de tener un valor de correlación mayor que 0.2 y menor que 0.8.Aquí hay un ejemplo de código que demuestra este enfoque:
Esto debería imprimir una lista de nombres de columnas que cumplen con los criterios que especificó. Luego puede utilizar esta lista para generar un subconjunto de su DataFrame original incluyendo solo esas columnas.