Tag: AMAZON-REDSHIFT
Estoy intentando usar SUM() de Redshift y funciones de ventana para realizar una suma acumulativa. Mis datos se ven así: ID item_date item_count 12 01/01/2019 11 12 02/01/2019 8 12 03/01/2019 0 12 04/01/2019 5 12 05/01/2019 21 12 06/01/2019 0 Actualmente, mi suma se ve así: SUM(item_count) over (partition . . . Read more
Objetivo Cargar todos los datos de archivos CSV en un bucket de S3 en una tabla de Redshift. Problema Algunos archivos carecen de un subconjunto de columnas. Ejemplo En el mundo real, mi bucket recibe nuevos CSVs diariamente, pero considera este ejemplo más simple. Supongamos que tengo una tabla fruit: . . . Read more
Tengo un registro que indica que un empleado se tomó unas vacaciones desde el 2020-08-01 hasta el 2020-08-20. Esta única fila debe ser transformada en 20 filas, una para cada día de vacaciones. ¿Cómo puedo hacer esto de manera rápida y escalable, ya que mis tablas contienen miles de registros . . . Read more
Confundido por el término ‘tamaño de tabla’ en Redshift. Tenemos: svvtableinfo.size “Tamaño de tabla en bloques de 1MB” svvtableinfo.pct_used “Porcentaje de espacio disponible utilizado” … así que asumo que gran parte del ‘tamaño’ es espacio vacío debido a las claves de ordenamiento, etc. Luego tenemos esto… https://aws.amazon.com/premiumsupport/knowledge-center/redshift-cluster-storage-space/ … que utiliza . . . Read more
Estoy buscando obtener un recuento continuo de clientes basado en su nivel de lealtad. Cada nivel se basa en un LTV (0-124.99, 125-198.99, 199-749.99 y 750+). Esto es lo que tengo hasta ahora, que solo devuelve 0 para cada fecha con algunos 1 dispersos a lo largo de los años. . . . Read more