es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: PYSPARK

AttributeError: El objeto ‘SparkContext’ no tiene el atributo ‘list_packages’ – AWS EMR Notebook

Estoy intentando instalar un nuevo paquete en AWS EMR Notebook y me estoy encontrando con el error “AttributeError: el objeto ‘SparkContext’ no tiene el atributo ‘list_packages’”. Sin embargo, esto parece ser el enfoque oficial. Agradezco su ayuda para encontrar lo que me falta. Código from pyspark.sql import SparkSession, Window from . . . Read more

Creando un esquema para convertir un dataframe de pandas a un dataframe de PySpark.

Intento crear un esquema para la conversión de un pandas df a un pyspark df. ¿Podría explicarme por favor qué estoy haciendo mal? Creando mySchema dtype_l, name_l, true_l = [],[],[] for col in df.columns: name_l.append(col) true_l.append(True) if df.y.dtype == ‘int64’: dtype_l.append(“IntegerType()”) if df.y.dtype == ‘float64’: dtype_l.append(“FloatType()”) l = list(zip(name_l, dtype_l, . . . Read more

Transforma filas y columnas y crea un dataframe de similitud utilizando Pyspark.

Ya tengo un conjunto de datos normalizado: df = spark.createDataFrame([('manzana roja', 'plátano maduro', 0.3), ('manzana roja', 'chile picante', 0.4), ('manzana roja','kiwi dulce', 0.5), ('plátano maduro','chile picante', 0.6), ('plátano maduro','kiwi dulce', 0.7), ('chile picante','kiwi dulce', 0.8)], ["frase1", "frase2", 'porcentaje_común']) df.show() +————–+—————-+———————-+—————-+ | frase1| frase2|porcentaje_común| +————–+—————-+———————-+—————-+ | manzana roja| plátano maduro| 0.3| . . . Read more