Tag: CLUSTER-ANALYSIS
Imaginemos que tenemos una columna (X) que contiene el id del cliente y varias otras columnas x1, x2, x3, x4, x5, x6 que solo tienen estos 4 valores distintos (‘Alto’, ‘Bajo’, ‘Medio’, ‘Nan’) repetidamente. Por favor haz clic en el enlace adjunto. Actualización reciente: 16/12/2021: He realizado una codificación one-hot . . . Read more
Soy realmente nuevo en Python y ciencia de datos y realmente necesitaría algo de ayuda, por favor. Tengo un dataframe con 440 observaciones y 6 variables descriptivas. Se supone que debo realizar un agrupamiento jerárquico de los datos, pero SOLO con la ayuda de los paquetes numpy y pandas. No . . . Read more
Hola, estoy intentando ejecutar un análisis SOM y K-means. Pero no puedo resolverlo porque hay un código de error. Error in storage.mode(x) <- “double” : el objeto ‘list’ no se puede convertir en el tipo ‘double’ ¿Cómo puedo resolver este problema? cdata
Estaba revisando el agrupamiento K-means y noté que su complejidad es O(n * K * I * d), donde n = número de puntos K = número de grupos I = número de iteraciones, y d = número de atributos. ¿Alguien podría por favor explicarme la diferencia entre puntos y . . . Read more
Hola, ¿hay alguna manera de imprimir las frecuencias absolutas de cada palabra en un clúster? Mi código se ve así: vectorizer = TfidfVectorizer() X = vectorizer.fit_transform(list) true_k = 4 model = KMeans(n_clusters=true_k, init=’k-means++’, max_iter=100, n_init=1) model.fit(X) print(“Top términos por clúster:”) order_centroids = model.cluster_centers_.argsort()[:, ::-1] terms = vectorizer.get_feature_names() for i in . . . Read more