Unir celdas duplicadas en lugar de eliminarlas
Estoy tratando de encontrar una solución para el siguiente problema que tengo.
Supongamos que tienes un dataframe con múltiples columnas – en este caso dos para una explicación más fácil. Ambas columnas contienen datos de cadena y no datos numéricos.
COL 1 COL2
Mike Test 1
Mike Test 2
Mike Test 3
Lo que me gustaría lograr es lo siguiente:
COL 1 COL 2
Mike Test 1
Test 2
Test 3
Solo necesito eliminar los duplicados dentro de la primera columna y dejar el dataframe como está.
¿Alguna idea de cómo hacerlo?
davy.ai
Para lograr esto, puedes utilizar las funciones
duplicated()
yfillna()
de pandas. Aquí está el código:Salida:
Aquí, primero usamos la función
duplicated()
para obtener una máscara booleana de los valores duplicados en la primera columna, luego aplicamos una función lambda para reemplazar los valores duplicados con una cadena vacía. Finalmente, usamosfillna()
para llenar las cadenas vacías con un espacio en blanco.