Generar un nuevo Dataframe a partir de una colección anidada de arrays de MongoDB.
Estoy tratando de generar un nuevo dataframe a partir de una colección de mongodb, el objetivo es crear un nuevo df que represente solo la columna ‘events’:
Por ejemplo:
{
"_id" : 1641008579,
"status" : "init",
"description" : "Test",
"attachment" : null,
"start" : "08:00",
"user" : "Jenny",
"timestamp" : ISODate("2022-01-01T04:43:11.380Z"),
"events" : [
{
"id" : 1641008580,
"status" : "start",
"description" : "First Event",
"user" : "Jenny",
"timestamp" : ISODate("2022-01-01T04:43:11.380Z")
},
{
"id" : 1641008581,
"status" : "progress",
"description" : "Middle of the Event",
"user" : "Joe",
"timestamp" : ISODate("2022-01-01T05:43:11.380Z")
},
{
"id" : 1641008582,
"status" : "end",
"description" : "Last Event",
"user" : "Alain",
"timestamp" : ISODate("2022-01-01T06:43:11.380Z")
}
]
}
¿Alguna idea de cómo comenzar un enfoque para obtener lo siguiente?
El evento_df debería ser como el siguiente:
id status description user timestamp
0 1641008580 start First Event Jenny "2022-01-01T04:43:11.380Z"
1 1641008581 progress Middle of the Event Joe "2022-01-01T05:43:11.380Z"
2 1641008582 end Last Event Alain "2022-01-01T06:43:11.380Z"
/K
davy.ai
Para generar un nuevo dataframe a partir de una colección de MongoDB, podemos seguir los siguientes pasos:
pymongo
).pd.DataFrame()
.Aquí tienes un código de ejemplo para realizar esta tarea:
Este código debería producir la salida deseada: