es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: AMAZON-EMR

La conexión a AWS RDS con Sqoop expira.

Estoy tratando de utilizar una conexión desde RDS en EMR a través de sqoop con el siguiente comando: sqoop list-tables \ –connect jdbc:postgresql://sportsdb.cxri########.us-east-2.rds.amazonaws.com:5432/SportsDB \ –username postgres \ –password mypassword Sin embargo, la conexión siempre expira. Según mi investigación, este error está relacionado con RDS siendo accesible públicamente y si las . . . Read more

Problema de límite de tamaño del almacenador de búfer de Spark

Estoy realizando la función de agregación a nivel de columna como: df.groupby(“a”).agg(collect_set(b)) El valor de la columna está aumentando más allá del tamaño predeterminado de 2 GB. Detalles del error: La tarea de Spark falla con una IllegalArgumentException: Cannot grow BufferHolder error. java.lang.IllegalArgumentException: Cannot grow BufferHolder by size 95969 because . . . Read more

Creando un clúster EMR basado en AMI utilizando Boto3

Tengo una AMI personalizada. Quiero crear un clúster EMR basado en esa AMI utilizando boto3. Revisé la documentación, encontré la versión de la CLI pero no encontré información sobre la versión de boto3. Versión de la CLI: aws emr create-cluster –name “Clúster con mi AMI personalizada” \ –custom-ami-id MiIDdeAMI –ebs-root-volume-size . . . Read more