Tag: AMAZON-ATHENA
Tengo una tabla con muchas particiones (algo en lo que estamos trabajando para reducir). Cuando consulto: SELECT * FROM mytable LIMIT 10 Obtengo: “HIVEEXCEEDED_PARTITION_LIMIT: La consulta sobre la tabla ‘mytable’ puede potencialmente leer más de 1000000 particiones” ¿Por qué la parte “LIMIT 10” de la consulta no es suficiente para . . . Read more
Contexto Estoy construyendo una consulta utilizando Athena y me di cuenta de que el uso de “NOT IN” está teniendo un impacto significativo en el tiempo de ejecución de la consulta. La consulta realiza una unión entre dos tablas y tiene como objetivo filtrar las filas del resultado excluyendo un . . . Read more
Estoy trabajando con una tabla que incluye una columna que es básicamente una matriz de datos de carga útil y estoy tratando de encontrar una manera de extraer todos los nombres de clave en ella. Inicialmente intenté desanidarla, pero recibí errores porque el tipo de columna es un ROW(). Entonces, . . . Read more
Tenemos diferentes formatos de marca de tiempo. yyyy MMM dd HH:mm:ss.SSS zzz MMM dd HH:mm:ss ZZZZ yyyy yyyy-MM-dd'T'HH:mm:ssZZZZ yyyy-MM-dd HH:mm:ss.SSS etc… Necesito verificar si la marca de tiempo se almacena en el formato yyyy-MM-dd HH:mm:ss.SSS utilizando SQL en Athena. ¿Hay alguna forma de validar como tal? Puedo validar si es . . . Read more
Gestiono algunos datos en AWS, y hay algunos archivos parquet en un bucket de S3. Todos los días, se agregarán nuevos archivos a este bucket, y me gustaría obtener los datos del último archivo utilizando Athena. Quiero saber cómo designar la ruta del archivo más reciente en la consulta de . . . Read more