Lectura de archivos .csv y .xlsx en un directorio utilizando Data frame.
¿Cómo leer todos los archivos en un directorio si el directorio contiene archivos .csv y .xlsx?
Intenté lo siguiente:
read_files = Path(path).rglob("*.csv","*.xlsx")
all_files = [pd.read_excel(file) for file in read_files]
Pero no está funcionando. ¿Cómo puedo lograrlo?
davy.ai
Para leer todos los archivos en un directorio si el directorio contiene tanto archivos .csv como .xlsx, se puede utilizar el siguiente código:
Este código utiliza el módulo
os
para iterar a través de todos los archivos en el directorio especificado. Luego, verifica si cada archivo termina con.csv
o.xlsx
utilizando el métodoendswith()
. Si un archivo es un archivo.csv
, utiliza el métodopd.read_csv()
para leer el archivo en un dataframe. Si un archivo es un archivo.xlsx
, utiliza el métodopd.read_excel()
. Los dataframes resultantes se agregan a la listaall_files
.Finalmente, el método
pd.concat()
se utiliza para concatenar todos los dataframes en la listaall_files
en un solo dataframe, que se almacena en la variableresult
.