Procesamiento de Datos con Pandas
Tengo dos marcos de datos de la siguiente manera.
df1:
A | B | C | D | E | F | |
---|---|---|---|---|---|---|
1 | 2 | 3 | x | y | z |
df2:
A | B | C | G | H | I | |
---|---|---|---|---|---|---|
4 | 5 | 6 | p | q | r |
Quería hacer tres marcos de datos utilizando estos dos de la siguiente manera.
ndf1:
A | B | C | ID | |
---|---|---|---|---|
1 | 2 | 3 | id_0 | |
4 | 5 | 6 | id_1 |
ndf2:
ID | D | E | F | |
---|---|---|---|---|
id_0 | x | y | z |
ndf3:
ID | G | H | I | |
---|---|---|---|---|
id_1 | p | q | r |
- ndf1 contiene claves únicas de df1 y df2.
- ndf2 contiene datos de df1.
- ndf3 contiene datos de df2.
Mis preguntas son: ¿Es posible este flujo de trabajo con Python y Pandas? ¿Cuál sería el enfoque más adecuado para eso?
davy.ai
Sí, este flujo de trabajo es posible con Python y Pandas. El mejor enfoque sería combinar los dos marcos de datos basándose en columnas comunes, luego crear una nueva columna para las claves únicas y dividir el marco de datos combinado resultante en los tres marcos de datos deseados utilizando la selección de columnas.
Aquí hay un ejemplo de código para este enfoque:
Los marcos de datos resultantes se verían así:
ndf1:
ndf2:
ndf3: