Tag: DATA-WRANGLING
Tengo un conjunto de datos de simulación con 500 réplicas: cada réplica contiene 300 identificadores. Cuando la réplica es igual a 1, los identificadores varían de 1 a 300; cuando la réplica es igual a 2, los identificadores nuevamente van de 1 a 300, y así sucesivamente. Quiero obtener lo . . . Read more
Estoy intentando convertir los valores en los encabezados de la tercera y cuarta columna en filas. df = pd.read_excel(“nombre_archivo.xlsx”, sheet_name = 0, header=[14,15,16,17,18]) df = df.melt(col_level=0, id_vars = [“Unnamed: 0_level_0”, “Unnamed: 0_level_1”], var_name=’Region’, value_name=’Value’) print(df.columns) datos del archivo de entrada Country1 Country1 Country1 Country Country1 Country2 2000 2000 2000 2001 . . . Read more
Lamento si la articulación de mi pregunta es confusa, no he podido encontrar hilos similares que aclaren el inglés de mi pregunta. Estoy trabajando con una muestra de datos que se asemeja a lo que se muestra a continuación: label1 label2 label3 label# value1 value4 value7 label2 value2 value5 value8 . . . Read more
Estoy limpiando algunos datos de encuestas que parecen haber permitido a los encuestados seleccionar múltiples categorías de raza. Me pregunto cómo puedo volver a codificar esto en una respuesta “multirracial” con fines de análisis. Actualmente he estado realizando una codificación manual bastante laboriosa que no ha dado resultado. Aquí está . . . Read more
Tengo un dataframe con múltiples columnas relacionadas con la misma variable, que me gustaría combinar en una sola columna. Sin embargo, la mayoría de las respuestas que encuentro aquí sobre este tema se refieren a la concatenación de columnas (por ejemplo, https://stackoverflow.com/questions/27906021/merge-2-columns-into-one-in-dataframe), mientras que yo quiero preservar cada celda individual . . . Read more