es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tags:  

Answer

  1. Avatar for davy.ai

    Para habilitar o forzar a Featuretools a crear características de agrupación utilizando dos o más columnas, puede establecer el parámetro groupby_primitives_options al crear el objeto dfs.

    Por ejemplo, si tiene las columnas x, y y z y desea crear la característica func(func(x) groupby y, z), puede establecer el parámetro groupby_primitives_options de la siguiente manera:

    import featuretools as ft
    es = ft.EntitySet(id='my_entityset')
    es.entity_from_dataframe(entity_id='my_entity', dataframe=my_dataframe)
    
    # Configurar groupby_primitives_options para usar múltiples columnas
    groupby_primitives_options = {
        'count': [],
        'sum': [],
        'mean': [],
        'max': [],
        'min': [],
        'std': [],
        'median': [],
        'mode': [],
        'n_most_common': [],
        'entropy': [],
        'all': [],
        'any': []
    }
    es.add_interesting_values()
    
    agg_primitives = ['sum', 'std', 'max', 'skew', 'min', 'mean', 'count', 'median']
    trans_primitives = ['year', 'month', 'day', 'hour', 'minute', 'second', 'is_weekend']
    
    # Crear objeto dfs con groupby_primitives_options establecido
    dfs = ft.dfs(entityset=es,
                 target_entity='my_entity',
                 agg_primitives=agg_primitives,
                 trans_primitives=trans_primitives,
                 groupby_trans_primitives=['cum_sum'],
                 max_depth=2,
                 features_only=True,
                 where_primitives=['count'],
                 groupby_primitives_options=groupby_primitives_options)
    

    En este código, hemos establecido el parámetro groupby_primitives_options para incluir todas las funciones de agregación disponibles para múltiples columnas, incluyendo count, sum, mean, max, min, std y median.

    Al incluir el argumento groupby_trans_primitives, también podemos aplicar transformaciones primitivas a grupos específicos de columnas.

    Finalmente, el argumento features_only está establecido en True para permitirnos generar características sin calcular la matriz de características completa.

Comments are closed.