Tag: CLUSTER-ANALYSIS
Tengo un conjunto de revisiones y las he agrupado con k-means y he obtenido a qué grupo pertenece cada revisión (p. ej., 1, 2, 3…). También tengo las etiquetas reales de a qué grupos pertenecen (p. ej., ubicación, comida, etc.) y necesito compararlos con el índice de Rand. Como tengo . . . Read more
Utilicé sklearn.dbscan en Python y el resultado solo proporciona las etiquetas de cada clúster, pero también quiero calcular la confianza del agrupamiento, o simplemente la distancia promedio del clúster de cada uno. ¿Tienen alguna idea?
Estoy trabajando en un proyecto que implica identificar características de texto en grupos específicos. Por ejemplo, imaginemos que hay dos grupos de textos: uno que contiene correos electrónicos enviados a empleados y otro que contiene correos electrónicos enviados a jefes. La idea es explorar si existen diferencias sintácticas o de . . . Read more
Estoy haciendo un trabajo de agrupamiento en algunos datos y me gustaría usar los ‘límites suaves’ del Modelo de Mezcla de Gaussianas (GMM) para conectar cada punto de datos a múltiples grupos al mismo tiempo, pero con diferentes grados de creencia. p.ej. un punto de datos puede tener un 60% . . . Read more
Estoy trabajando en un conjunto de datos de miles de frases. El conjunto de datos está estructurado por una columna y K filas. Tengo que encontrar algunas similitudes entre ellos y estoy haciendo un análisis de clusterización. Creé un corpus y lo convertí en números (TF-IDF) y luego comencé con . . . Read more