Cómo mezclar según la columna (id) pero mantener True ascendente.

davy.ai

July 14, 2023 at 10:58 pm

Para mezclar el dataframe según la columna ‘id’ manteniendo el orden descendente inicial de la columna ‘id’, podemos primero ordenar el dataframe basándonos en la columna ‘id’ en orden descendente utilizando la función sort_values(). Luego podemos usar la función groupby() para agrupar el dataframe por la columna ‘id’ y aplicar la función sample() a cada grupo para mezclar las filas dentro de cada grupo. Finalmente, podemos restablecer el índice del dataframe mezclado utilizando la función reset_index().

El código para mezclar el dataframe según la columna ‘id’ manteniendo el orden descendente inicial de la columna ‘id’ es el siguiente:

shuffled_df = df.sort_values('id', ascending=False).groupby('id').apply(lambda x: x.sample(frac=1)).reset_index(drop=True)

Este código primero ordena el dataframe original df basándose en la columna ‘id’ en orden descendente usando sort_values('id', ascending=False). Luego agrupa el dataframe ordenado por la columna ‘id’ usando groupby('id'). Para cada grupo, aplica la función sample(frac=1) para mezclar las filas dentro del grupo. El argumento frac=1 especifica que queremos muestrear todo el grupo, lo que efectivamente lo mezcla. Finalmente, restablece el índice del dataframe mezclado utilizando reset_index(drop=True) para obtener un nuevo dataframe mezclado llamado shuffled_df.

Este código debería producir la salida deseada mostrada en la pregunta, donde los bloques están mezclados aleatoriamente dentro del dataframe pero aún mantienen su orden descendente original basado en la columna ‘id’.

Answer

davy.ai

July 14, 2023 at 10:58 pm
Para mezclar el dataframe según la columna ‘id’ manteniendo el orden descendente inicial de la columna ‘id’, podemos primero ordenar el dataframe basándonos en la columna ‘id’ en orden descendente utilizando la función sort_values(). Luego podemos usar la función groupby() para agrupar el dataframe por la columna ‘id’ y aplicar la función sample() a cada grupo para mezclar las filas dentro de cada grupo. Finalmente, podemos restablecer el índice del dataframe mezclado utilizando la función reset_index().

El código para mezclar el dataframe según la columna ‘id’ manteniendo el orden descendente inicial de la columna ‘id’ es el siguiente:
```
shuffled_df = df.sort_values('id', ascending=False).groupby('id').apply(lambda x: x.sample(frac=1)).reset_index(drop=True)
```
Este código primero ordena el dataframe original df basándose en la columna ‘id’ en orden descendente usando sort_values('id', ascending=False). Luego agrupa el dataframe ordenado por la columna ‘id’ usando groupby('id'). Para cada grupo, aplica la función sample(frac=1) para mezclar las filas dentro del grupo. El argumento frac=1 especifica que queremos muestrear todo el grupo, lo que efectivamente lo mezcla. Finalmente, restablece el índice del dataframe mezclado utilizando reset_index(drop=True) para obtener un nuevo dataframe mezclado llamado shuffled_df.

Este código debería producir la salida deseada mostrada en la pregunta, donde los bloques están mezclados aleatoriamente dentro del dataframe pero aún mantienen su orden descendente original basado en la columna ‘id’.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Cómo mezclar según la columna (id) pero mantener True ascendente.

Answer

davy.ai