Tag: AZURE-DATABRICKS

Las variables de entorno de Azure Databricks para alternar contienen comillas en Python.

05 Jun, 2023 Programación 0

Sé que hay muchas preguntas aquí sobre cómo manejar las citas en las variables de entorno. Esta pregunta tiene un enfoque diferente, por favor continue leyendo: Antes de la semana pasada, configuramos nuestras variables de entorno en nuestro clúster de databricks (7.3 LTS, incluye Apache Spark 3.0.1, Scala 2.12) de . . . Read more

Obtener lista de todas las notebooks en mi espacio de trabajo de Databricks.

04 Jun, 2023 Programación 0

¿Cómo puedo obtener una lista de todos los cuadernos en mi espacio de trabajo y almacenar sus nombres junto con la ruta completa en un archivo csv? He intentado usar la opción Databricks CLI, pero parece que no tiene una operación recursiva. databricks workspace list

Cómo convertir YYYY-MM-DD a YYYYMMDD en la API de SPARK SQL

04 Jun, 2023 Programación 0

Cómo convertir YYYY-MM-DD en YYYYMMDD en Spark SQL. Ejemplo 2021-11-25 debería ser 20211121. En SQL SERVER es fácil con la ayuda de convert () o Format (). ¿Cómo hacerlo en SPARK SQL? No quiero convertir esto en DataFrame o DF. Buscando una respuesta usando spark sql. ¡Esta no es una . . . Read more

Conéctese a Databricks desde Python a través de la identidad gestionada.

04 Jun, 2023 Programación 0

Logré conectarme a Databricks desde Python utilizando el siguiente fragmento de código: from databricks import sql connection = sql.connect( serverhostname='<server-hostname>’, httppath='<http-path>’, access_token='<personal-access-token>’) cursor = connection.cursor() cursor.execute(‘SELECT * FROM <database-name>.<table-name> LIMIT 2’) result = cursor.fetchall() for row in result: print(row) cursor.close() Este fragmento proviene de la documentación oficial (enlace a la . . . Read more

¿Usar paramGrid con TrainValidationSplit causa que se ejecute toda la canalización cada vez o solo el paso que necesita ser optimizado?

03 Jun, 2023 Programación 0

Estoy utilizando PySpark en Azure Databricks. Tengo un pipeline con StringIndexers, OneHotEncoders, un VectorAssembler y un LinearSVC: pipeline = Pipeline(stages=["stringvar1_indexer", "stringvar2_indexer", "stringvar2_encoder", "assembler", "svc"]) Para encontrar los parámetros óptimos para el SVC, utilizo un paramGrid para iterar en el parámetro de regularización y las iteraciones máximas: paramGrid = ParamGridBuilder() \ . . . Read more

1 … 18 19 20 21

es.davy.ai

¿Tienes una pregunta?

Tag: AZURE-DATABRICKS

Las variables de entorno de Azure Databricks para alternar contienen comillas en Python.

Obtener lista de todas las notebooks en mi espacio de trabajo de Databricks.

Cómo convertir YYYY-MM-DD a YYYYMMDD en la API de SPARK SQL

Conéctese a Databricks desde Python a través de la identidad gestionada.

¿Usar paramGrid con TrainValidationSplit causa que se ejecute toda la canalización cada vez o solo el paso que necesita ser optimizado?