¿Cuál será la mejor práctica para la preprocesamiento de conjuntos de datos mixtos? ¿La matriz de distancia de Gower de un conjunto de datos mixto o las columnas nominales codificadas en one-hot del mismo conjunto de datos? La matriz de distancia de Gower me dio un gráfico umap en un . . . Read more
Alguien sabe cómo convertir este código de Python en un código que pueda ejecutar con Flask? km4 = KMeans(n_clusters=3, init=’k-means++’, max_iter=300, n_init=10, random_state=0) y_means = km4.fit_predict(reduced_data) predict = km4.predict(reduced_data) data = np.array(reduced_data) fig = plt.figure(figsize=(20,10)) plt.scatter(data[y_means==0, 0], data[y_means==0, 1], s=50, c=’blue’, label=’Cluster0′) plt.scatter(data[y_means==1, 0], data[y_means==1, 1], s=50, c=’orange’, label=’Cluster1′) plt.scatter(data[y_means==2, . . . Read more
Considere los siguientes datos: A = [-1 -1 -1 0 1 -1 -1 0 0 1 1 1 1 -1 1 0 1]; ¿Cómo se puede calcular el tamaño y la frecuencia de aparición de los grupos en A (de vecinos similares), preferiblemente usando comandos incorporados en MATLAB? El resultado . . . Read more
Tengo un conjunto de datos donde estoy intentando agrupar una columna con 986 observaciones utilizando el siguiente código. PremiumPrice_Sclaed <- scale(data$PremiumPrice) plot(PremiumPrice_Sclaed) d <- dist(PremiumPrice_Sclaed) # Escalando para el agrupamiento fit.average <- hclust(d, method=”average”) plot(fit.average, cex = .1, main=”Agrupamiento con Enlace Promedio”) ¿Alguien puede decirme cómo solucionar el dendrograma de . . . Read more
Tengo una lista larga con el formato mylist =[([256, 408, 147, 628], ‘ezis’), ([628, 526, 236, 676], ‘camera’), ([526, 876, 676, 541], ‘camera’), ([567, 731, 724, 203], ‘size’), ([822, 187, 256, 172], ‘camera’), ([489, 628, 214, 428], ‘esu’), ([648, 487, 487, 338], ‘take’), ([487, 606, 338, 428], ‘pictur’),…..] La lista . . . Read more