Estoy obteniendo un error después de ejecutar un trabajo de Glue desde el flujo de trabajo. El error indica: “ERROR DE EJECUCIÓN | El archivo –class no existe. Consulte los registros para obtener más detalles.” También hemos intentado pasar el parámetro del trabajo como “–class GlueApp”, a pesar de que . . . Read more
Estoy utilizando py4j para ejecutar un procedimiento almacenado (Redshift). La conexión JDBC se crea en AWS Glue. A continuación se muestra el código: import sys from awsglue.transforms import * from awsglue.utils import getResolvedOptions from pyspark.context import SparkContext from awsglue.context import GlueContext from awsglue.job import Job from awsglue import DynamicFrame args . . . Read more
¿Es posible subir un archivo de Excel a un bucket de S3 (ubicación de entrada = archivo XLSX), crear un conjunto de datos Databrew a partir de ese archivo de Excel y crear una receta en AWS Glue Databrew que convierta ese archivo de Excel a un archivo CSV (ubicación . . . Read more
He ejecutado un crawler en un archivo JSON en S3 para actualizar una tabla externa existente. Una vez finalizado, revisé el SVL_S3LOG para ver la estructura de la tabla externa y vi que se actualizó y tengo una nueva columna con tipo Array, como se esperaba. Cuando intenté ejecutar select . . . Read more