Tag: XGBOOST
Tengo una población de 2 millones de personas y 700 variables (que tienen muchos nulos, ceros o -9999), para las cuales desarrollo un modelo en python, que funciona de la siguiente manera: Genero un dataframe de toda la población y las variables. Elimino las variables que no necesito (como el . . . Read more
A continuación tengo código, en el que intento entrenar un modelo XGBoost en R que se detenga tempranamente después de un número determinado de rondas early_stopping_rounds sin mejora. watchlist <- list(train=dtrain, test=dtest) param <- list( objective = "binary:logistic", eta = 0.3, max_depth = 8, eval_metric="logloss" ) xgb.train(params = param, data . . . Read more
Estoy inspeccionando el siguiente modelo: Y me di cuenta de que los nodos de hoja (leaf) no están en el mismo orden de magnitud que los datos de entrada (.9 vs .09). ¿Significa esto que una vez que se elige un nodo de hoja, multiplicará los datos de entrada por . . . Read more
Recientemente compré un Macbook Pro con M1 Pro y finalmente logré instalar las bibliotecas arm64 para ciencia de datos con miniforge, siguiendo parcialmente este artículo (P.D.: recuerda usar solo un gestor de paquetes, ya sea conda (preferiblemente) o pip, para la instalación de paquetes). Por ahora, ejecutar el stacking regressor . . . Read more
Entrené un modelo utilizando xgboost v0.90 para que fuera compatible con el motor de ML de AWS SageMaker. Estoy realizando la codificación habitual y la sintonización de hiperparámetros. Algunos fragmentos de código a continuación: import pandas as pd import pickle from xgboost import XGBRegressor from sklearn.model_selection import train_test_split, GridSearchCV, RandomizedSearchCV . . . Read more