Tag: PANDAS-GROUPBY
Estoy tratando de aprender pandas y python para transferir algunos problemas de Excel a pandas/python. Tengo un archivo CSV grande de mi banco con más de 10000 registros. Quiero categorizar los registros basándome en la descripción. Para eso, tengo un archivo de mapeo grande con palabras clave. En Excel usaba . . . Read more
Tengo un diccionario de datos que me gustaría representar gráficamente. Mi diccionario está estructurado actualmente de la siguiente manera: (# = algún número) data = { ’15’: [{‘x’: #, ‘y’: #}, {‘x’: #, ‘y’: #}, etc..], ’16’: [{‘x’: #, ‘y’: #}, {‘x’: #, ‘y’: #}, etc..], ’17’: [{‘x’: #, ‘y’: . . . Read more
Tengo un requisito en el que necesito calcular el cambio porcentual para un grupo de órdenes. Lo que he hecho hasta ahora funciona bien si hay un número igual de filas para el subgrupo dentro del grupo principal. También necesito tener en cuenta la cantidad. tiempo tipo_transacc símbolo cantidad precio . . . Read more
Tengo el siguiente DataFrame de juguete llamado df: df = pd.DataFrame({‘foo’ : [‘red’, ‘red’, ‘red’, ‘blue’, ‘blue’, ‘blue’, ‘green’, ‘green’, ‘green’], ‘bar’ : [10, -5, 7, 14, 20, 3, 40, -100, 75]}) foo bar red 10 red -5 red 7 blue 14 blue -20 blue 3 green 40 green -100 . . . Read more
Para el conjunto de datos de juguete a continuación, estoy tratando de agrupar por target_name y ordenar los valores por varias columnas: valid_mse, valid_r2_score usando: df.groupby(‘target_name’).sort_values(by=[‘valid_mse’, ‘valid_r2_score’], ascending=[True, False]) target_name train_mse valid_mse train_r2_score valid_r2_score 0 CPI 1.102079 1.842212 0.947458 -0.624665 1 CPI 1.301734 1.890085 0.928005 -0.777463 2 CPI 0.471222 1.078413 . . . Read more