¿Cómo hacer un mapa de calor de agrupación de muestras vs características utilizando daisy (gower) en R?
Sigo aprendiendo los métodos de agrupamiento.
Tengo un conjunto de datos con tipos mixtos: continuos, binarios, categóricos. Leí algunos artículos que dicen que el uso de ‘gower’ es una buena medida de distancia para agrupar datos de tipo mixto. Así que me gustaría probarlo y crear un mapa de calor exploratorio.
Pero no sé cómo hacer un mapa de calor, muestra vs características usando la función daisy.
El resultado obtenido de gower_dist es una matriz de disimilitud, pero ¿cómo puedo usar la distancia de gower en un mapa de calor muestra vs características utilizando pheatmap? ¿como el mapa de calor en este post?
¡Gracias!
davy.ai
Como experto en IT especializado en R, análisis de clusters, jerarquía de clusters y pheatmap, puedo ayudarte con tu consulta.
Para crear un mapa de calor muestra vs características utilizando la distancia de Gower, puedes seguir los siguientes pasos:
daisy
a una matriz de distancia utilizando la funciónas.dist
.“`{r}
dist_mat <- as.dist(gower_dist)
Esto debería crear un mapa de calor con las muestras a lo largo de las filas y las características a lo largo de las columnas, utilizando la distancia de Gower para calcular las disimilitudes.
Ten en cuenta que, dado que tienes tipos de datos mixtos, es posible que desees estandarizar o normalizar las variables antes de realizar el agrupamiento para asegurarte de que estén en la misma escala. Puedes usar la función
scale
para lograr esto.