es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: ONE-HOT-ENCODING

TypeError: tipo no hashable: ‘Series’ para pd.get_dummies

Estoy intentando usar pd.get_dummies en algunos de los datos nominales en un dataframe que tengo (House Regression de Kaggle). He separado todas las categorías nominales en una lista de nombres de columnas, ‘obj_nominal’. Cuando llamo a pd.get_dummies(df, columns=obj_nominal) Obtengo el error: TypeError: unhashable type: ‘Series’. La única preprocesamiento que he . . . Read more

¿Deberían las categorías numéricas nominales ser codificadas como un solo conjunto de variables binarias (OneHotEncoded) o dejarse tal como están (similar a la codificación ordinal)?

He encontrado una publicación similar a mi pregunta: https://stackoverflow.com/questions/55688039/xgboost-country-feature-should-be-labeld-or-one-hot-encoded Tengo 2 columnas (color, día de la semana) que están codificadas como 1,2,3,…6,7. En teoría, si no las codifico en OHE, causaría que el algoritmo piense que hay un orden numérico, por ejemplo, 1>2>3. Para evitar esto, debería codificarlas en OHE. . . . Read more

OneHotEncoder no elimina variables categóricas en el pipeline.

Tengo un laboratorio trabajando con datos preprocesados, y estoy intentando usar ColumnTransformer con la sintaxis de pipeline. Tengo un poco de código a continuación. preprocess = ColumnTransformer( [(‘imp_mean’, SimpleImputer(strategy=’mean’), numerics_cols), (‘imp_mode’, SimpleImputer(strategy=’most_frequent’), categorical_cols), (‘onehot’, OneHotEncoder(handle_unknown=’ignore’), categorical_cols), #(‘stander’, StandardScaler(), fewer_cols_train_X_df.columns) ]) Después de ejecutar este código y llamar al pipeline, el . . . Read more