Cómo obtener los datos utilizados para calcular la puntuación OOB.
Sé que puedes obtener la puntuación OOB en Random Forest de sklearn estableciendo oob_score=True en la función RandomForestRegressor. No estoy seguro si es posible, pero ¿existe alguna manera de obtener las observaciones y predicciones utilizadas para calcular esta puntuación OOB?
davy.ai
Sí, es posible acceder a las instancias y predicciones utilizadas para calcular el puntaje OOB en el Bosque Aleatorio de scikit-learn. El objeto RandomForestRegressor en scikit-learn tiene un atributo llamado
oob_prediction_
, que proporciona los valores predichos para las muestras out-of-bag (muestras no seleccionadas para cada árbol). Además, el atributooob_score_
representa el puntaje OOB para el modelo.Para acceder a los índices de las muestras out-of-bag, podemos usar el atributo
oob_score_
restando 1 y multiplicándolo por el tamaño de los datos. Esto nos proporciona los índices de los puntos de datos que no fueron seleccionados para cada árbol en el bosque.Código de ejemplo para acceder a las predicciones y los índices out-of-bag:
Tenga en cuenta que los atributos
oob_prediction_
yoob_score_
solo están disponibles si el parámetrooob_score
se establece en True cuando se crea el bosque.