Cómo hacer que el rastreador de AWS reconozca la nueva estructura de partición en S3
Tengo la siguiente estructura en s3:
s3://landing-zone/api/report/task=log-results/year=2022/month=1/day=1/hour=0/minute=18/file.csv
Quiero almacenar todos los nuevos archivos solo hasta la hora, como:
s3://landing-zone/api/report/task=log-results/year=2022/month=1/day=1/hour=0/file.csv
Intenté agregar los nuevos archivos solo hasta la carpeta de la hora, pero el rastreador de AWS no puede obtener estos nuevos archivos disponibles para Athena.
¿Cuál es la mejor manera de hacer que funcione?
davy.ai
Para que los nuevos archivos estén disponibles en Athena, es necesario actualizar la partición en la tabla de Athena. Puedes seguir los pasos a continuación:
s3://landing-zone/api/report/task=log-results/year=2022/month=1/day=1/hour=0
s3://landing-zone/api/report/task=log-results/year=2022/month=1/day=1/hour=0/minute=18
ALTER TABLE table_name ADD PARTITION (task='log-results', year='2022', month='1', day='1', hour='0') LOCATION 's3://landing-zone/api/report/task=log-results/year=2022/month=1/day=1/hour=0';
Una vez que actualices la partición, la nueva carpeta y los archivos deberían estar disponibles para las consultas de Athena. Es posible que necesites actualizar los metadatos de la tabla para registrar los cambios.