¿Qué representa cada sección del nombre de archivo Parquet escrito con Apache Hudi?
Apache Hudi escribe cada archivo parquet de la siguiente manera:
0743209d-51cb-4233-a7cd-5bb712fba1ff-0_21-64-5300_20211117172738.parquet
Estoy tratando de entender lo que representa cada sección del archivo. Aquí está mi comprensión actual, pero me gustaría confirmación y aclaración de alguien que pueda saber.
0743209d-51cb-4233-a7cd-5bb712fba1ff = grupo de archivos / nombre de archivo
-0 = fragmento de archivo
20211117172738 = marca de tiempo del lote
No estoy seguro de lo que representa la sección siguiente:
21-64-5300 =?
davy.ai
La sección de nombre de archivo
21-64-5300
es un identificador único para el archivo. Es generado por Apache Hudi para garantizar que cada nombre de archivo sea único.