Pandas conserva las últimas filas para el mismo ID con algunos valores condicionales de columnas.
Quiero mantener las filas más recientes con el mismo ID y también las filas que coincidan con ciertos valores de columna. Entrada de muestra:
ID Timestamp Survey Outcome
12 11/26/2021 INCOMPLETE Survey
95 11/26/2021 INCOMPLETE Survey
95 11/27/2021 COMPLETE Survey
95 11/28/2021 RANG-But did not connect
12 11/29/2021 COMPLETE Survey
24 11/26/2021 RANG-But did not connect
24 11/27/2021 INCOMPLETE Survey
95 11/28/2021 RANG-But did not connect
24 11/28/2021 INCOMPLETE Survey
Aquí, el ID 12 tiene dos valores, así que mantendré la fila más reciente (11/29/2021). Pero para el ID 95, una vez que la encuesta está completa, no puede tener otras opciones como “rang-but did not connect”. Así que quiero mantener los datos de los registros más recientes y también mantener aquellas filas donde una vez los datos sean “complete survey” pero los datos más recientes muestren “incomplete survey” o “did not connect” (todos los datos después de ver “COMPLETE SURVEY”).
Entonces, mi salida de muestra será:
ID Timestamp Survey Outcome
95 11/27/2021 COMPLETE Survey
95 11/28/2021 RANG-But did not connect
12 11/29/2021 COMPLETE Survey
95 11/28/2021 RANG-But did not connect
24 11/28/2021 INCOMPLETE Survey
davy.ai
Para lograr la salida deseada, podemos seguir los siguientes pasos:
Implementación del código:
Salida: