Tag: PANDAS-GROUPBY
Para cada ciudad, quiero crear una nueva columna que sea la escala minmax de otra columna (edad). Intenté esto y obtengo el mensaje de error El input contiene el infinito o un valor demasiado grande para el tipo de dato (‘float64’). cols=[‘age’] def f(x): scaler1=preprocessing.MinMaxScaler() x[‘age_minmax’] = scaler1.fit_transform(x[cols]) return x . . . Read more
Aquí está mi DataFrame de entrada: df = pd.DataFrame([ [‘CA’, ‘LAX’, ‘Alice’], [‘NY’, ‘NYC’, ‘Alice’], [‘TX’, ‘HOU’, ‘Alice’], [‘CA’, ‘SFO’, ‘Bob’], [‘NY’, ‘NYC’, ‘Bob’], [‘TX’, ‘AUS’, ‘Bob’], [‘CA’, ‘LAX’, ‘Carol’], [‘NY’, ‘ALB’, ‘Carol’], [‘TX’, ‘HOU’, ‘Carol’], [‘CA’, ‘LAX’, ‘Dan’], [‘NY’, ‘NYC’, ‘Dan’], [‘TX’, ‘DAL’, ‘Dan’], [‘CA’, ‘SFO’, ‘Eve’], [‘NY’, ‘NYC’, . . . Read more
Tengo un dataframe que contiene datos de acciones y está agrupado por acciones (ver imagen adjunta como ejemplo), el índice es cada minuto de datos para cada acción y la segunda columna es el símbolo de la acción. Estoy tratando de aplicar indicadores de ‘Pandas TA’ al dataframe usando groupby . . . Read more
No pude averiguar cómo calcular objetos retrasados que provienen de la operación df.groupby.apply(). Realmente agradezco si alguien puede ayudar. Aquí hay un código de muestra que escribí: import pandas as pd import dask df = pd.DataFrame(columns=[‘id’,’id2′,’val1′]) df[‘id’] = [‘A’,’A’,’A’,’B’,’C’,’C’,’D’,’D’] df[‘id2’]=[‘a’,’a’,’b’,’a’,’a’,’b’,’b’,’b’] df[‘val1′]= [1,2,3,4,5,6,7,8] @dask.delayed def dask_test(group,val_col): for idx,row in group.iterrows(): group.loc[idx,’test’]=2*group.loc[idx,val_col] . . . Read more
He estado atrapado en un problema donde he realizado todas las operaciones de agrupación y he obtenido el dataframe resultante que se muestra a continuación, pero el problema se presentó en la última operación de cálculo de una columna adicional. Dataframe actual: code industry category count duration 2 Retail Mobile . . . Read more