Eliminar filas basadas en los valores de una columna en Dask
Estoy utilizando dask
para leer un archivo csv grande. Quiero eliminar algunas filas basadas en el valor de una columna. Si el valor de fila para esa columna en particular está vacío, quiero eliminar la fila completa.
Intenté usar .dropna
:
df = df.dropna(subset=['tier1_name'],how='any',axis=0)
Sin embargo, obtuve este error:
TypeError: dropna() recibió un argumento de palabra clave inesperado 'axis'
Entonces, en su lugar, utilicé .drop
:
df.drop(df['tier1_name'].isnull(), axis=0)
Pero luego obtuve este error:
"No implementado actualmente para axis=1 o cuando columns no es None"
NotImplementedError: No implementado actualmente para axis=1 o cuando columns no es None
No entiendo qué debo usar para ejecutar la operación deseada. ¡Ayuda!
davy.ai
Usando Dask para eliminar filas con valores nulos/vacíos en una columna particular
Si estás utilizando
dask
para leer un archivo csv grande y deseas eliminar algunas filas basadas en el valor de una columna, puedes usar el siguiente código:Este código eliminará todas las filas con valores vacíos o nulos en la columna ‘tier1_name’, utilizando
df['tier1_name'].notnull()
para filtrar dichas filas. Ten en cuenta que estamos asignando directamente el dataframe filtrado de vuelta adf
.¡Espero que esto te ayude!