Cómo transformar la inversa después de realizar el agrupamiento

davy.ai

August 6, 2023 at 12:24 pm

Para recuperar sus datos después de aplicar el algoritmo de agrupamiento K-means en un conjunto de datos escalados con MinMaxScaler, primero necesita aplicar la transformación inversa del MinMaxScaler en los datos escalados utilizando el método inverse_transform(). Luego puede agregar las etiquetas de los clústeres al marco de datos. Aquí está el código que se puede utilizar para lograr esto:

# Aplicar la transformación inversa en los datos escalados
unscaled_df = pd.DataFrame(scaler.inverse_transform(scaled_df), columns=scaled_df.columns)

# Crear una copia de los datos no escalados
copy_df = unscaled_df.copy()

# Ajustar el agrupamiento K-means en los datos no escalados
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(unscaled_df)

# Agregar las etiquetas de los clústeres al marco de datos
copy_df['Cluster'] = kmeans.labels_

# Calcular la media de cada característica para cada clúster
mean_df = copy_df.groupby('Cluster').mean()

La variable unscaled_df contiene los datos no escalados, que luego se copian en copy_df en el cual se realiza el agrupamiento K-means. Se agrega la columna Cluster a copy_df para indicar la etiqueta del clúster de cada punto de datos. Finalmente, se puede calcular la media de cada característica para cada clúster utilizando el método groupby() en el marco de datos copy_df.

Answer

davy.ai

August 6, 2023 at 12:24 pm
Para recuperar sus datos después de aplicar el algoritmo de agrupamiento K-means en un conjunto de datos escalados con MinMaxScaler, primero necesita aplicar la transformación inversa del MinMaxScaler en los datos escalados utilizando el método inverse_transform(). Luego puede agregar las etiquetas de los clústeres al marco de datos. Aquí está el código que se puede utilizar para lograr esto:
```
# Aplicar la transformación inversa en los datos escalados
unscaled_df = pd.DataFrame(scaler.inverse_transform(scaled_df), columns=scaled_df.columns)

# Crear una copia de los datos no escalados
copy_df = unscaled_df.copy()

# Ajustar el agrupamiento K-means en los datos no escalados
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(unscaled_df)

# Agregar las etiquetas de los clústeres al marco de datos
copy_df['Cluster'] = kmeans.labels_

# Calcular la media de cada característica para cada clúster
mean_df = copy_df.groupby('Cluster').mean()
```
La variable unscaled_df contiene los datos no escalados, que luego se copian en copy_df en el cual se realiza el agrupamiento K-means. Se agrega la columna Cluster a copy_df para indicar la etiqueta del clúster de cada punto de datos. Finalmente, se puede calcular la media de cada característica para cada clúster utilizando el método groupby() en el marco de datos copy_df.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Cómo transformar la inversa después de realizar el agrupamiento

Answer

davy.ai