Tag: CLUSTER-ANALYSIS

¿Cómo realizar el agrupamiento cuando tengo múltiples columnas categóricas y menos columnas numéricas en pandas?

20 Jul, 2023 Programación 0

Imaginemos que tenemos una columna (X) que contiene el id del cliente y varias otras columnas x1, x2, x3, x4, x5, x6 que solo tienen estos 4 valores distintos (‘Alto’, ‘Bajo’, ‘Medio’, ‘Nan’) repetidamente. Por favor haz clic en el enlace adjunto. Actualización reciente: 16/12/2021: He realizado una codificación one-hot . . . Read more

Agrupamiento jerárquico en python usando solo numpy/pandas.

20 Jul, 2023 Programación 0

Soy realmente nuevo en Python y ciencia de datos y realmente necesitaría algo de ayuda, por favor. Tengo un dataframe con 440 observaciones y 6 variables descriptivas. Se supone que debo realizar un agrupamiento jerárquico de los datos, pero SOLO con la ayuda de los paquetes numpy y pandas. No . . . Read more

Cómo solucionar el error: Error in storage.mode(x) <- "double" : el objeto 'list' no se puede convertir a tipo 'double'.

18 Jul, 2023 Programación 0

Hola, estoy intentando ejecutar un análisis SOM y K-means. Pero no puedo resolverlo porque hay un código de error. Error in storage.mode(x) <- “double” : el objeto ‘list’ no se puede convertir en el tipo ‘double’ ¿Cómo puedo resolver este problema? cdata

¿Cuál es la diferencia entre atributos y puntos en la agrupación?

17 Jul, 2023 Programación 0

Estaba revisando el agrupamiento K-means y noté que su complejidad es O(n * K * I * d), donde n = número de puntos K = número de grupos I = número de iteraciones, y d = número de atributos. ¿Alguien podría por favor explicarme la diferencia entre puntos y . . . Read more

Python Kmeans Imprimir la frecuencia absoluta de palabras en cada clúster

17 Jul, 2023 Programación 0

Hola, ¿hay alguna manera de imprimir las frecuencias absolutas de cada palabra en un clúster? Mi código se ve así: vectorizer = TfidfVectorizer() X = vectorizer.fit_transform(list) true_k = 4 model = KMeans(n_clusters=true_k, init=’k-means++’, max_iter=100, n_init=1) model.fit(X) print(“Top términos por clúster:”) order_centroids = model.cluster_centers_.argsort()[:, ::-1] terms = vectorizer.get_feature_names() for i in . . . Read more

1 2 3 4 … 7

es.davy.ai

¿Tienes una pregunta?