Tag: ARCHIVE
Tengo una hoja de cálculo para rastrear las membresías y pagos mensuales. Duplico la hoja al final del mes, la renombro con la fecha y la bloqueo para archivarla. Tengo una macro grabada y configurada para hacer esto y tengo un botón en la hoja para hacer clic en él. . . . Read more
He utilizado df.to_parquet(path="…", partition_cols="period") para escribir un dataframe en archivos parquet en HDFS (Cloudera CDH). Esto funciona bien, se crea una estructura de subcarpetas (period=YYYYMMDD) y cuando leo archivos parquet individuales contienen los datos esperados (como se esperaba, no contienen la columna period ya que fue particionada). Ahora estoy tratando . . . Read more
Tiene el siguiente algoritmo para seleccionar registros, siguiendo el ejemplo escrito a continuación, se deben seleccionar los siguientes registros. Si “issuedate” es una columna vacía, entonces tomar “publid”, que tiene más “inn”. Si “issuedate” no es totalmente igual, entonces tomamos “issuedate” = última fecha. Si “issuedate” es igual, entonces tomamos . . . Read more
Tengo alrededor de 90 tablas en Hive, de las cuales 10 se combinan mediante el uso de “union all” en 9 tablas maestras. Estas 90 tablas base se actualizan con nuevas filas cada 15 minutos. Necesitamos actualizar las filas insertadas recientemente en las tablas maestras cada 15 minutos. Verificar el . . . Read more
Estoy intentando exportar datos de Excel a una tabla Hive. Al hacerlo, tengo una columna ‘ABC’ que tiene valores como ‘1, 2, 3’. Usé la función de vista lateral de explode, pero no hace nada con mis datos. A continuación se muestra mi fragmento de código: CREATE TABLE nombre_de_tabla ( . . . Read more