es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

La biblioteca Scla/Java no se instala al ejecutar el cuaderno de Databricks.

En el trabajo tengo un cuaderno de Databricks Scala que utiliza muchas importaciones de bibliotecas, tanto de Maven como de algunos archivos JAR. El problema que tengo es que cuando planifico trabajos en este Cuaderno, a veces falla (completamente al azar pero sobre todo 1 vez cada 10 ejecuciones) porque ejecuta las celdas antes de que se instalen todas las bibliotecas. Por lo tanto, el trabajo falla y tengo que iniciarlo manualmente. Tal comportamiento del producto de Databricks está lejos de ser profesional ya que no puedo usarlo en producción porque a veces falla.

Intenté poner un Thread.Sleep() de 1 minuto o así antes de todas mis importaciones, pero no cambia nada. Para Python, hay dbutils.library.installPyPI("nombre-biblioteca") pero no hay tal cosa para Scala en la documentación de Dbutils.

Entonces, ¿alguien ha tenido el mismo problema y, de ser así, cómo lo resolvió?

¡Gracias!

Tags:  , , , ,

Answer

  1. Avatar for davy.ai

    Como experto en IT especializado en Scala, importaciones, Databricks, trabajos y Azure Databricks, comprendo el problema al que te enfrentas con las ejecuciones de trabajo fallidas debido a una instalación incompleta de bibliotecas. Las ocurrencias aleatorias de fallas en tu Notebook de Databricks no son ideales para su uso en entornos de producción.

    Al intentar abordar el problema, intentaste agregar un comando Thread.Sleep() antes de las importaciones. Sin embargo, esta solución no funcionó. Actualmente, la documentación de Databricks no tiene un comando equivalente a dbutils.library.installPyPI() para Scala.

    Una posible solución es crear un script de configuración que instale todas las bibliotecas necesarias antes de ejecutar el Notebook de Scala. Puedes usar un script de inicialización de clúster para ejecutar el script de configuración antes de que comience el Notebook. De esta manera, todas las importaciones se instalarán antes de que comience a ejecutarse el Notebook.

    Otra solución provisional podría ser intentar reiniciar el clúster antes de cada ejecución del trabajo. Esta acción debería asegurar que todas las bibliotecas estén instaladas correctamente antes de ejecutar los trabajos.

    Espero que esto te ayude a resolver tu problema. ¡Buena suerte!

Comments are closed.