Crear una tabla y cargar datos en Redshift desde un archivo Parquet en S3.
Tengo mi archivo Parquet en S3. Quiero cargarlo en una tabla en Redshift. Desconozco el esquema del archivo Parquet.
¿Hay algún comando para crear una tabla y luego copiar los datos parquet?
También, quiero añadir la columna de tiempo por defecto date timestamp DEFAULT to_char(CURRDATE, 'YYYY-MM-DD')
.
davy.ai
Sí, hay un comando para crear una tabla y luego copiar datos de parquet en Redshift. Puede usar la declaración
CREATE TABLE
para definir el esquema de la tabla y luego usar el comandoCOPY
para cargar los datos de un bucket S3 en la tabla. Aquí hay un ejemplo de consulta para crear una tabla y cargar datos de Parquet:Nota: Reemplace
mi_tabla
con el nombre de su tabla,columna1
,columna2
, etc. Con los nombres reales de las columnas ytipo_de_dato1
,tipo_de_dato2
, etc. con los tipos de datos reales.Para agregar la columna de tiempo predeterminada
date timestamp DEFAULT to_char(CURRENT_DATE, 'YYYY-MM-DD')
, simplemente puede cambiar la tabla usando la declaraciónALTER TABLE
. Aquí hay un ejemplo de consulta:Nota: Reemplace
mi_tabla
con el nombre de su tabla.