¿Cuál será la mejor práctica para la preprocesamiento de conjuntos de datos mixtos? ¿La matriz de distancia de Gower de un conjunto de datos mixto o las columnas nominales codificadas en one-hot del mismo conjunto de datos? La matriz de distancia de Gower me dio un gráfico umap en un . . . Read more
Considere un dataframe df con la siguiente estructura: – Name Slide Height Weight Status General A X 3 0.1 0.5 0.2 B Y 10 0.2 0.7 0.8 … Me gustaría crear duplicados para cada fila en este dataframe (específicamente para Name y Slide) para las siguientes combinaciones de Height y . . . Read more
Tengo un dataframe de Pandas que contiene unas columnas y unas filas. ColXYZ. Intervalo. Temperatura. Presión. ColCDE. A. 121 0 25 60 0.195 B. 246 4 40 50 0.350 C. 241 0 40 50 0.133 …. Me gustaría crear duplicados de cada fila cuando el valor de Intervalo es 0, . . . Read more
Tengo un problema con un problema del dataframe de Python Pandas. Tengo dos dataframes con contenido diferente. Quiero obtener las palabras que no están en el dataframe 2 y guardarlas en un nuevo dataframe. ¿Alguien puede ayudarme a resolver este problema utilizando el dataframe de Python Pandas? Muchas gracias… Donde . . . Read more
Dado el siguiente problema, Entrada: lis = [‘0-10,000, 10,001-11,000, 11,001-12,000’] Salida: [‘0-10,000′,’10,001-11,000’, ‘11,001-12,000’] Cree una función tal que evite si hay un solo rango en la lista, pero divida los rangos si hay múltiples rangos en la lista. ¿Alguien puede ayudarme con este problema, ni siquiera puedo pensar en ningún . . . Read more