¿Cómo mostrar el enlace del panel de control de Dask al enviar un trabajo de Dask-Yarn de forma remota?

davy.ai

June 10, 2023 at 1:56 pm

Posible solución:

Parece que la sentencia logging.debug no se está imprimiendo o registrando correctamente al usar dask-yarn. Una solución potencial es modificar el archivo main.py para escribir directamente el enlace del tablero en un archivo, el cual se puede leer después de que se completa la tarea. Aquí está un ejemplo:

import sys
from dask_yarn import YarnCluster
from dask.distributed import Client

cluster = YarnCluster.from_current()
client = Client(cluster)
dashboard_link = client.dashboard_link

# Escribir enlace del tablero en un archivo
with open('/mnt/dashboard-link.txt', 'w') as f:
    f.write(dashboard_link)

# Ejecutar la tarea real
run()

Este código modificado escribirá el enlace del tablero en un archivo llamado dashboard-link.txt en el directorio raíz del sistema de archivos S3 de EMRFS. Luego, puede descargar este archivo desde S3 después de que se completa la tarea para recuperar el enlace del tablero.

Alternativamente, puede intentar modificar el archivo submit.sh para capturar la salida del trabajo dask-yarn y guardarla en un archivo para su análisis posterior. Por ejemplo:

dask-yarn submit \
  --name uq_component_batch_inference \
  --deploy-mode remote \
  --environment uq_component_dask.tar.gz \
  --worker-count 500 \
  --worker-vcores 1 \
  --worker-memory 8GiB \
  --worker-env TOKENIZERS_PARALLELISM=True \
  --worker-restarts 9 \
  main.py > dask-yarn.log 2>&1

Este script modificado capturará toda la salida del trabajo dask-yarn y la guardará en un archivo llamado dask-yarn.log, el cual puede buscar el enlace del tablero. Tenga en cuenta que esto puede contener una gran cantidad de salida, por lo que puede llevar algún esfuerzo encontrar la información relevante.

Answer

davy.ai

June 10, 2023 at 1:56 pm
Posible solución:

Parece que la sentencia logging.debug no se está imprimiendo o registrando correctamente al usar dask-yarn. Una solución potencial es modificar el archivo main.py para escribir directamente el enlace del tablero en un archivo, el cual se puede leer después de que se completa la tarea. Aquí está un ejemplo:
```
import sys
from dask_yarn import YarnCluster
from dask.distributed import Client

cluster = YarnCluster.from_current()
client = Client(cluster)
dashboard_link = client.dashboard_link

# Escribir enlace del tablero en un archivo
with open('/mnt/dashboard-link.txt', 'w') as f:
    f.write(dashboard_link)

# Ejecutar la tarea real
run()
```
Este código modificado escribirá el enlace del tablero en un archivo llamado dashboard-link.txt en el directorio raíz del sistema de archivos S3 de EMRFS. Luego, puede descargar este archivo desde S3 después de que se completa la tarea para recuperar el enlace del tablero.

Alternativamente, puede intentar modificar el archivo submit.sh para capturar la salida del trabajo dask-yarn y guardarla en un archivo para su análisis posterior. Por ejemplo:
```
dask-yarn submit \
  --name uq_component_batch_inference \
  --deploy-mode remote \
  --environment uq_component_dask.tar.gz \
  --worker-count 500 \
  --worker-vcores 1 \
  --worker-memory 8GiB \
  --worker-env TOKENIZERS_PARALLELISM=True \
  --worker-restarts 9 \
  main.py > dask-yarn.log 2>&1
```
Este script modificado capturará toda la salida del trabajo dask-yarn y la guardará en un archivo llamado dask-yarn.log, el cual puede buscar el enlace del tablero. Tenga en cuenta que esto puede contener una gran cantidad de salida, por lo que puede llevar algún esfuerzo encontrar la información relevante.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

¿Cómo mostrar el enlace del panel de control de Dask al enviar un trabajo de Dask-Yarn de forma remota?

Answer

davy.ai