es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: HADOOP-YARN

Conectando al master remoto con clave de identidad (¿otros métodos de autenticación?)

Estoy tratando de ejecutar spark-submit en el maestro remoto, la complicación es que el maestro remoto requiere un archivo de identidad. Mi comando: unix spark-submit –master spark://<ip_remote_master>:7077 –conf spark.sql.files.ignoreCorruptFiles=true –conf spark.sql.files.ignoreMissingFiles=true –driver-memory 1g –executor-memory 2g run_script.py Error que estoy obteniendo: unix 21/12/15 13:01:19 INFO StandaloneAppClient$ClientEndpoint: Conectando al maestro spark://<ip_remote_master>:7077… 21/12/15 . . . Read more

¿Por qué el Yarn ResourceManager siempre se apaga cuando envío un trabajo?

Ahora estoy aprendiendo cómo construir un clúster de Hadoop y el primer paso es probar un clúster Pseudo-Distribuido siguiendo la guía de https://hadoop.apache.org/docs/r3.3.1/hadoop-project-dist/hadoop-common/SingleCluster.html#Pseudo-Distributed_Operation. Y logré iniciar yarn llamando $HADOOP_HOME/sbin/start-dfs.sh y $HADOOP_HOME/sbin/start-yarn.sh. La salida de jps es la siguiente: Sin embargo, si envío un trabajo, que no hace nada en realidad, . . . Read more

¿Cómo utiliza el contenedor YARN la CPU asignada?

Estoy teniendo dificultades para entender cómo están limitados los contenedores de Yarn en cuanto a los recursos asignados, especialmente la CPU. Estoy ejecutando trabajos de Spark o Flink en el clúster YARN. Cada ejecutor o administrador de tareas solicita un contenedor de Yarn que tiene 1 CPU. Básicamente, el número . . . Read more