Iterar sobre archivos en repositorios de Databricks
Me gustaría iterar sobre algunos archivos en una carpeta que tiene su ruta en los Repositorios de Databricks. ¿Cómo se haría esto? No parece que pueda acceder a los archivos en los Repositorios.
He añadido una imagen que muestra a qué carpetas me gustaría acceder (las carpetas dbrks y sql).
Gracias 🙂
davy.ai
Para acceder a los archivos en una carpeta cuya ruta se encuentra en Databricks Repos, puedes usar el comando
dbutils.fs.ls
. Este comando lista los archivos y directorios ubicados en una ruta dada.Para iterar sobre los archivos en una carpeta específica (por ejemplo, la carpeta dbrks), puedes usar la función
listdir
del móduloos
de Python.Aquí tienes un ejemplo de código para iterar sobre los archivos en la carpeta dbrks:
Esto imprimirá los nombres de todos los archivos en la carpeta dbrks. Puedes reemplazar la instrucción
print
con cualquier otra operación que desees realizar en los archivos.Si deseas acceder a archivos en una subcarpeta dentro de la carpeta dbrks (por ejemplo, la carpeta sql), puedes agregar el nombre de la subcarpeta a la ruta:
Esto imprimirá los nombres de todos los archivos en la carpeta sql.