Tag: APACHE-ARROW
Solo una pregunta general. ¿Alguien sabe cómo eliminar toda la primera fila de un dataframe de pyspark? He intentado usar el siguiente código, pero eso deja vacía mi salida de dataframe en formato parquet: updated_bulk=bulk_spark_df.filter (merged_mas_bulk_spark_df.'Number!='part=') Número es una columna y parte es una ocurrencia de datos en la primera . . . Read more
Intento obtener la sesguez de cada fila del dataframe con library(moments) install.packages(“FactoMineR”) data <- read.csv(“data.csv”, header=TRUE, sep=”;”, dec=”.”) Mi dataframe: df <- structure(list(Marque = c(“x1”, “x2”, “x3”, “x4”, “x5”, “x6”, “x7”, “x8”, “x9”), V1 = c(“2”, “3”, “1,5”, “1,2”, “1,9”, “3,5”, “3,3”, “4”, “3,6”), V2 = c(“2,4”, “4”, “3,4”, “3,6”, . . . Read more
Esta podría ser una pregunta fácil, disculpa por eso. Quiero eliminar la fila específica en la columna condiciones. Si la columna C de la tercera fila (solo la tercera fila) no es igual a 1, quiero eliminar la tercera fila, de lo contrario (como en el ejemplo) quiero mantener los . . . Read more
Dado: Supongamos que un bloque de 8K (8,192 bytes) tiene seis filas, cada una exactamente de 1,000 bytes, para un total de 6,000 bytes. Las seis filas están una después de la otra, desde la fila 1 hasta la fila 6, sin espacio entre ellas. Supongamos que el encabezado del . . . Read more
Tengo un dataframe de Pandas de este tipo: data = {‘Index’:[‘1a’,’2a’,’3a’,’4a’], ‘col1’:[20.1,20.2,20.3,20.4], ‘col2’: [30.2,30.5,30.7,30.5]} df1 = pd.DataFrame(data) df1 = df1.set_index(‘Index’) print(df1) Salida: col1 col2 Index 1a 20.1 30.2 2a 20.2 30.5 3a 20.3 30.7 4a 20.4 30.5 Ahora mi objetivo es seleccionar la fila con un índice específico, por ejemplo . . . Read more