Tag: DELTA-LAKE
Resumen del problema: Fallo al consultar datos a través de AWS Athena en una tabla Delta Lake (en S3). Creo que el problema ocurre específicamente si la cuenta tiene habilitada Lake Formation. Pasos para replicar: Asegúrese de hacer esto en una cuenta de AWS nueva, o una cuenta que aún . . . Read more
Estoy tratando de conectarme usando el método DSR, pero estoy obteniendo el siguiente error al leer archivos de instantánea en formato parquet en la ruta de Azure ADLSGen2. He agregado algunas dependencias de Maven: Ej. hadoop-client, hadoop-azure, parquet-hadoop, scala-library, spark-core_2.12. Error: Exception in thread “main” java.lang.NoClassDefFoundError: scala/runtime/java8/JFunction0$mcJ$sp at io.delta.standalone.internal.SnapshotManagement.getLogSegmentForVersion(SnapshotManagement.scala:102) at . . . Read more
Estoy un poco confundido/a acerca de los APD (autómatas con pila) y cómo definir la tupla. Tengo el lenguaje L = { 0^n1^n | n >= 0 } y sé que los APD son una sextupla con Q, sigma, gamma, delta, q0 y F. Sé cómo definir todos excepto delta. . . . Read more
Tengo esta tabla: CREATE TABLE `db`.`customer_history` ( `name` STRING, `addrress` STRING, `filename` STRING, `dt` DATE) USING delta PARTITIONED BY (dt) Cuando uso esto para cargar datos en una partición de la tabla: df .write .partitionBy(“dt”) .mode(“overwrite”) .format(“delta”) .saveAsTable(“db.customer_history”) Por alguna razón, sobrescribe toda la tabla. Pensé que el modo “overwrite” . . . Read more
Si creo una tabla externa en Databricks, ¿cómo puedo verificar su ubicación (en Delta Lake) utilizando una consulta SQL?