Tag: ONE-HOT-ENCODING
Tengo una columna de un DataFrame que contiene listas separadas por tuberías “|” e incluye información innecesaria. Estoy teniendo problemas al codificar en one-hot encoding la lista. Por ejemplo, quiero que: Estudiante Carrera Historia 111 ACCT (198720)|MGMT (200045)|NDGD (200630) 112 INST (201326)|ACCT (198720) se codifique de la siguiente manera: Estudiante . . . Read more
Digamos que tengo el siguiente df: data = [{‘c1′:’a’, ‘c2′:’x’}, {‘c1′:’b’,’c2′:’y’}, {‘c1′:’c’,’c2′:’z’}] df = pd.DataFrame(data) Resultado: c1 c2 0 a x 1 b y 2 c z Ahora quiero usar pd.get_dummies() para encodear en caliente (one-hot encode) las dos columnas categóricas c1 y c2, y eliminar la primera categoría de . . . Read more
Tengo un conjunto de datos que muestra cada transacción como una fila. por ejemplo; Item1 Item2 Item_3 NaN 1 1 1 1 NaN La tabla tiene 611 columnas con 1180 filas, por lo tanto, 611 elementos y 1180 transacciones. Estoy buscando realizar un análisis de cesta, por lo tanto, necesito . . . Read more
Aquí está el código: from sklearn.preprocessing import OneHotEncoder from sklearn.compose import ColumnTransformer one_hot = OneHotEncoder() transformer = ColumnTransformer([(“one_hot”, one_hot, cat_features)], remainder=”passthrough”) transformed_X = transformer.fit_transform(mmp_filled) transformed_X Las características “cat_features” incluyen columnas con números (que se consideran categorías) y cadenas de caracteres: Aquí está el DataFrame “mmp_filled” imagen. El error es el . . . Read more
Estoy creando un modelo de aprendizaje automático para calcular la tasa de victorias en un juego según la combinación de personajes. Tengo un error en la última línea al usar la función de pérdida. Creo que es porque la entrada es un vector one-hot. La salida del modelo no es . . . Read more