es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: PANDAS-GROUPBY

En agrupamiento con transformación minmax

Para cada ciudad, quiero crear una nueva columna que sea la escala minmax de otra columna (edad). Intenté esto y obtengo el mensaje de error El input contiene el infinito o un valor demasiado grande para el tipo de dato (‘float64’). cols=[‘age’] def f(x): scaler1=preprocessing.MinMaxScaler() x[‘age_minmax’] = scaler1.fit_transform(x[cols]) return x . . . Read more

pandas – mostrar los N conteos más altos en un dataframe agrupado

Aquí está mi DataFrame de entrada: df = pd.DataFrame([ [‘CA’, ‘LAX’, ‘Alice’], [‘NY’, ‘NYC’, ‘Alice’], [‘TX’, ‘HOU’, ‘Alice’], [‘CA’, ‘SFO’, ‘Bob’], [‘NY’, ‘NYC’, ‘Bob’], [‘TX’, ‘AUS’, ‘Bob’], [‘CA’, ‘LAX’, ‘Carol’], [‘NY’, ‘ALB’, ‘Carol’], [‘TX’, ‘HOU’, ‘Carol’], [‘CA’, ‘LAX’, ‘Dan’], [‘NY’, ‘NYC’, ‘Dan’], [‘TX’, ‘DAL’, ‘Dan’], [‘CA’, ‘SFO’, ‘Eve’], [‘NY’, ‘NYC’, . . . Read more

Cómo aplicar Pandas TA a un Dataframe con Groupby

Tengo un dataframe que contiene datos de acciones y está agrupado por acciones (ver imagen adjunta como ejemplo), el índice es cada minuto de datos para cada acción y la segunda columna es el símbolo de la acción. Estoy tratando de aplicar indicadores de ‘Pandas TA’ al dataframe usando groupby . . . Read more

funciones retardadas de Dask en objetos groupby de pandas

No pude averiguar cómo calcular objetos retrasados que provienen de la operación df.groupby.apply(). Realmente agradezco si alguien puede ayudar. Aquí hay un código de muestra que escribí: import pandas as pd import dask df = pd.DataFrame(columns=[‘id’,’id2′,’val1′]) df[‘id’] = [‘A’,’A’,’A’,’B’,’C’,’C’,’D’,’D’] df[‘id2’]=[‘a’,’a’,’b’,’a’,’a’,’b’,’b’,’b’] df[‘val1′]= [1,2,3,4,5,6,7,8] @dask.delayed def dask_test(group,val_col): for idx,row in group.iterrows(): group.loc[idx,’test’]=2*group.loc[idx,val_col] . . . Read more