Crear una nueva columna en un dataframe de pandas utilizando una fórmula.
Pregunta
Déjame reformular mi pregunta:
Tengo el siguiente conjunto de datos:
data = {
'globalId': {0: 4388064, 1: 4388200, 2: 4399344, 3: 4400638, 4: 4401765, 5: 4401831},
'publicatieDatum': {0: '2018-07-31', 1: '2018-09-24', 2: '2018-08-02', 3: '2018-08-04', 4: '2018-08-05', 5: '2018-08-06'},
'postcode': {0: '1774PG', 1: '7481LK', 2: '1068MS', 3: '5628EN', 4: '7731TV', 5: '5971CR'},
'koopPrijs': {0: 139000.0, 1: 209000.0, 2: 267500.0, 3: 349000.0, 4: 495000.0, 5: 162500.0}
}
df = pd.DataFrame(data)
print(df)
Este es el código para el nombre del municipio del código postal de la primera fila:
>>> nomi.query_postal_code(["1774"])
Ahora, quiero agregar una columna llamada ‘Gemeente’.
Esto se puede obtener utilizando la siguiente fórmula:
>>> nomi.query_postal_code(["postcode"])
El código postal anterior debería indicar los 4 números del código postal dentro de la columna de código postal.
Tengo 2 preguntas:
- ¿Cómo puedo agregar un código que calcule el gemeente para todas las filas en el marco de datos anterior, basado en el ‘codigo postal’, como se especifica arriba?
-
¿Cómo se puede escribir este código para que solo seleccione los primeros 4 dígitos en la columna de código postal?
¡Disculpas y gracias!
davy.ai
Se puede utilizar el siguiente código para añadir una columna llamada ‘Gemeente’ al dataframe:
Este código tomará los primeros 4 dígitos de la columna de códigos postales y los utilizará para consultar la librería
nomi
en busca del correspondiente nombre de municipio. El resultado será almacenado en la nueva columna ‘Gemeente’.