Tag: AZURE-DATABRICKS
En múltiples ocasiones he tenido un problema al actualizar una tabla delta en Databricks donde la sobrescritura del esquema falla la primera vez, pero luego tiene éxito la segunda vez. La solución a mi problema fue simplemente ejecutarlo nuevamente y no puedo reproducirlo en este momento. Si vuelve a ocurrir, . . . Read more
Estoy utilizando Spark SQL y he creado algunas Vistas para unir algunos datos, pero tengo que unir estas Vistas basándome en una columna de texto. Por eso tuve que utilizar el operador like. select table.perfume,table2.perfume from global_temp.gv_table1 table1 join global_temp.gv_table2 table2 on(lower(table1.perfume) like CONCAT(‘%’, lower(table2.perfume), ‘%’)) Pero el problema con . . . Read more
Voy a ingresar datos utilizando un cuaderno de Databricks. Quiero validar el esquema de los datos ingresados contra lo que espero que sea el esquema de estos datos. Entonces básicamente tengo: validation_schema = StructType([ StructField("a", StringType(), True), StructField("b", IntegerType(), False), StructField("c", StringType(), False), StructField("d", StringType(), False) ]) data_ingested_good = [("foo",1,"blabla","36636"), . . . Read more
Estaba tratando de ejecutar el código Scala a continuación en el cuaderno de Azure Databricks. Estaba ejecutándose bien pero no mostraba nada en la salida. Después de ejecutar, solo muestra defined object mainobj. ¿Cómo puedo mostrar la salida? object mainobj{ def main(args:Array[String])={ print(“Hola”) } }
Estaba intentando ejecutar la siguiente consulta en Azure data bricks. query = s”” “CON pre<em>file</em>user AS( SELECT id, typeid, CASO cuando dttm es nulo o dttm = ” entonces cast (‘1900-01-01 00:00:00.000’ como marca de tiempo) sino lanzar(dttm como marca de tiempo) del dde<em>pre</em>file<em>user</em>supp ) “” “” spark.sql(query) Luego obtuve . . . Read more