AWS-DATA-WRANGLER - es.davy.ai

Leer datos de AWS S3 utilizando pyspark y python. (Leer todas las columnas: también la columna partitioned)

06 Aug, 2023 Programación 0

He guardado el dataframe de Spark en AWS S3 en formato Parquet, particionando por la columna “channel_name”. A continuación se muestra el código que utilizé para guardar en S3: df.write.option(“header”,True) \ .partitionBy(“channel_name”) \ .mode(“overwrite”) \ .parquet(“s3://ruta/”) channel_name start_timestamp value Outlier TEMP 2021-07-19 07:27:51 21 false TEMP 2021-07-19 08:21:05 24 false . . . Read more

es.davy.ai

¿Tienes una pregunta?

Tag: AWS-DATA-WRANGLER

Leer datos de AWS S3 utilizando pyspark y python. (Leer todas las columnas: también la columna partitioned)