¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: APACHE-SPARK-SQL

Descomprimir JSON en PysparkSQL

23 May, 2023 Programación 0

Estoy buscando explotar un json anidado a un archivo CSV. Buscando analizar el json anidado en filas y columnas. from pyspark.sql import SparkSession from pyspark.sql import SQLContext from pyspark.sql.types import * from pyspark.sql import functions as F from pyspark.sql import Row df=spark.read.option(“multiline”,”true”).json(“sample1.json”) df.printSchema() root |– pid: struct (nullable = true) . . . Read more

Manipulación de Dataframe en Spark

23 May, 2023 Programación 0

Dataframe de entrada: caseid indicador 1 STP 1 no-STP 2 STP 3 STP 3 no-STP Dataframe de salida: caseid indicador 1 no-STP 2 STP 3 no-STP Hola a todos, estaría muy agradecido si alguien pudiera ayudarme con el dataframe anterior. En el dataframe de salida, solo quiero mantener los casos . . . Read more

Pyspark transforma cada fila de un dataframe en múltiples filas.

22 May, 2023 Programación 0

Soy un traductor de español que traduce documentos de IT. Traduzca lo siguiente al español. No traduzca el código ni la salida en formato Markdown. Soy nuevo en Apache Spark y estoy luchando por hacer algo que parece simple. En Snowflake tienen el concepto de UDTF, básicamente una función de . . . Read more

Cómo agregar una columna a PySpark DF, el formato de datos debe ser una lista y proviene de datos agrupados de la tabla original.

21 May, 2023 Programación 0

Pregunta Soy nuevo en pyspark, no estoy seguro si hay una manera fácil de hacer esto. Tengo un df con los intereses de las personas, por ejemplo: nombre interés A gimnasio A comida A juegos B juegos A partir de este df, me gustaría crear uno nuevo de la siguiente . . . Read more

1 … 47 48