Tag: APACHE-SPARK-SQL
Estoy buscando explotar un json anidado a un archivo CSV. Buscando analizar el json anidado en filas y columnas. from pyspark.sql import SparkSession from pyspark.sql import SQLContext from pyspark.sql.types import * from pyspark.sql import functions as F from pyspark.sql import Row df=spark.read.option(“multiline”,”true”).json(“sample1.json”) df.printSchema() root |– pid: struct (nullable = true) . . . Read more
Dataframe de entrada: caseid indicador 1 STP 1 no-STP 2 STP 3 STP 3 no-STP Dataframe de salida: caseid indicador 1 no-STP 2 STP 3 no-STP Hola a todos, estaría muy agradecido si alguien pudiera ayudarme con el dataframe anterior. En el dataframe de salida, solo quiero mantener los casos . . . Read more
Soy un traductor de español que traduce documentos de IT. Traduzca lo siguiente al español. No traduzca el código ni la salida en formato Markdown. Soy nuevo en Apache Spark y estoy luchando por hacer algo que parece simple. En Snowflake tienen el concepto de UDTF, básicamente una función de . . . Read more
Pregunta Soy nuevo en pyspark, no estoy seguro si hay una manera fácil de hacer esto. Tengo un df con los intereses de las personas, por ejemplo: nombre interés A gimnasio A comida A juegos B juegos A partir de este df, me gustaría crear uno nuevo de la siguiente . . . Read more