Tag: APACHE-SPARK-SQL

Escribiendo desde un marco de datos de Spark a una etapa (stage) de Snowflake.

05 Aug, 2023 Programación 0

Soy nuevo en Snowflake y muy ingenuo en cuanto a Spark. ¿Existe alguna referencia o buen ejemplo de cómo se escribe datos desde un dataframe de Spark a una etapa con nombre en Snowflake? ¡Agradezco tu ayuda!

¿El método spark.sql.functions.typedLit admite Map[String, Any]?

05 Aug, 2023 Programación 0

Tengo un mapa de tipo Map[String, String] que quiero agregar dentro de otro mapa2 de tipo Map[String, Any]. Más tarde, este mapa2 se añadirá como una columna en un dataframe. Cuando intento agregar map2 como una columna usando spark.sql.functions.typedLit, falla con el siguiente error: Tipo de literal no admitido class . . . Read more

¿Cómo puedo extraer la fecha de una columna de tipo estructura en un dataframe de PySpark?

05 Aug, 2023 Programación 0

Estoy trabajando con un dataframe de PySpark que tiene una columna de tipo struct como se muestra a continuación: df.printSchema() <h1>root</h1> <h1>|– timeframe: struct (nullable = false)</h1> <h1>| |– start: timestamp (nullable = true)</h1> <h1>| |– end: timestamp (nullable = true)</h1> <p>“`</p> Entonces intenté usar <code>collect()</code> y pasar los timestamps/ventanas . . . Read more

Spark lee todas las tablas desde MSSQL y luego aplica una consulta SQL.

05 Aug, 2023 Programación 0

Tengo configurado un clúster de Spark 3. Tengo algunos datos en SQL Server y su tamaño es de aproximadamente 100 GB. Tengo que realizar diferentes consultas en estos datos desde el clúster de Spark. Me he conectado a SQL Server desde Spark a través de JDBC y he ejecutado una . . . Read more

Cómo calcular el tamaño óptimo de la tabla pequeña para realizar una unión de transmisión en Spark.

05 Aug, 2023 Programación 0

En un clúster de Spark con 6 ejecutores, tenemos 48GB de RAM y 6 núcleos por ejecutor. Como parte de una optimización de un join entre 2 tablas, ¿cuál debería ser el tamaño óptimo de la tabla pequeña que se debe utilizar como parte de un broadcast join? ¿Existe una . . . Read more

1 2 3 4 … 48

es.davy.ai

¿Tienes una pregunta?

Tag: APACHE-SPARK-SQL

Escribiendo desde un marco de datos de Spark a una etapa (stage) de Snowflake.

¿El método spark.sql.functions.typedLit admite Map[String, Any]?

¿Cómo puedo extraer la fecha de una columna de tipo estructura en un dataframe de PySpark?

Spark lee todas las tablas desde MSSQL y luego aplica una consulta SQL.

Cómo calcular el tamaño óptimo de la tabla pequeña para realizar una unión de transmisión en Spark.