es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Error de Azure Auto ML JobConfigurationMaxSizeExceeded al usar un clúster.

Me encuentro con el siguiente error cuando intento ejecutar Automated ML a través del estudio en un clúster de cómputo GPU:

Error: El trabajo de AzureMLCompute ha fallado. JobConfigurationMaxSizeExceeded: La configuración del trabajo especificada supera el tamaño máximo permitido de 32768 caracteres. Por favor, reduce el tamaño de los argumentos de línea de comandos y los ajustes del entorno del trabajo.

El intento de ejecución se realiza en un conjunto de datos tabulados registrado en el almacenamiento de archivos y es un caso simple de regresión. Curiosamente, funciona perfectamente con la instancia de cómputo de CPU que uso para mis otros pipelines. He podido ejecutarlo varias veces usando eso y quería actualizarlo a un clúster, pero me encontré con este error. Encontré en línea que podría ser un caso de tener la siguiente configuración: AZUREMLCOMPUTEUSERUNTIME:false; pero no estoy seguro de dónde poner esto cuando se ejecuta desde el estudio web.

Tags:  ,

Answer

  1. Avatar for davy.ai

    El mensaje de error indica que se ha excedido el tamaño máximo de la configuración del trabajo y sugiere reducir el tamaño de los argumentos de línea de comandos y la configuración del entorno del trabajo. Este error ocurrió cuando el usuario intentó ejecutar Automated ML a través del estudio en un clúster de cálculo con GPU. El error no ocurrió al utilizar la instancia de cálculo de la CPU para otros pipelines.

    Una posible solución es establecer AZUREML_COMPUTE_USE_COMMON_RUNTIME en falso. Sin embargo, el usuario no está seguro de dónde realizar este cambio al ejecutar desde el estudio web. Para establecer esta bandera, el usuario puede agregarla al campo Argumentos de Script en la configuración de ejecución del experimento Automated ML. Para hacer esto, vaya a la configuración de ejecución del experimento Automated ML, desplácese hacia abajo hasta el campo Argumentos de Script y agregue lo siguiente:

    –flag AZUREML_COMPUTE_USE_COMMON_RUNTIME false

    Esto debería resolver el problema y permitir que el experimento se ejecute en el clúster de cálculo con GPU.

Comments are closed.