es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Después de la ajuste de hiperparámetros, la precisión permanece igual.

Estaba intentando ajustar los parámetros, pero después de hacerlo, la puntuación de precisión no ha cambiado en absoluto, ¿qué estoy haciendo mal?

# Log reg 
from sklearn.linear_model import LogisticRegression 
logreg = LogisticRegression(C=0.3326530612244898, max_iter=100, tol=0.01) 
logreg.fit(X_train, y_train)

from sklearn.metrics import confusion_matrix 

y_pred = logreg.predict(X_test) 

print('La precisión de la regresión logística es:', logreg.score(X_test, y_test)) 

confusion_matrix(y_test, y_pred) 
# 0,9181286549707602 - precisión antes de ajustar

Resultado:

La precisión de la regresión logística es: 0.9181286549707602 
array([[54, 9],
       [5, 103]])

Aquí estoy usando Grid Search CV:

from sklearn.model_selection import GridSearchCV 
params = {'tol': [0.01, 0.001, 0.0001],
          'max_iter': [100, 150, 200],
          'C': np.linspace(1, 20) / 10}

grid_model = GridSearchCV(logreg, param_grid=params, cv=5)
grid_model_result = grid_model.fit(X_train, y_train) 
print(grid_model_result.best_score_, grid_model_result.best_params_)

Resultado:

0.8867405063291139 {'C': 0.3326530612244898, 'max_iter': 100, 'tol': 0.01}
Tags:  , , ,

Answer

  1. Avatar for davy.ai

    Parece que has ajustado los hiperparámetros de tu modelo de regresión logística usando GridSearchCV, pero la puntuación de precisión no ha mejorado. Aquí hay algunas razones por las que esto podría haber sucedido:

    1. Rango de parámetros insuficiente: los valores de hiperparámetros elegidos para la búsqueda en cuadrícula podrían no ser lo suficientemente amplios para capturar los valores óptimos. Por lo tanto, es importante explorar un amplio rango de valores de parámetros para asegurarse de que los valores óptimos estén incluidos.
    2. Sobreajuste: si el rango de parámetros se establece demasiado amplio, puede provocar sobreajuste en los datos de entrenamiento. En ese caso, el modelo podría funcionar bien en los datos de entrenamiento, pero no en los datos de validación o prueba. Para evitar el sobreajuste, es importante establecer rangos realistas para los parámetros y usar la validación cruzada para estimar el rendimiento.

    3. Calidad de los datos: el rendimiento de los modelos de aprendizaje automático está estrechamente relacionado con la calidad de los datos. Si los datos son ruidosos o incompletos, puede afectar negativamente el rendimiento del modelo.

    4. Otros problemas algorítmicos: Finalmente, puede haber otros problemas específicos del algoritmo utilizado. Por ejemplo, algunos algoritmos como la regresión logística pueden requerir ciertas configuraciones de parámetros para funcionar mejor. Por lo tanto, es importante comprender bien el algoritmo y elegir la configuración de parámetros en consecuencia.

    En resumen, la sintonización de hiperparámetros es un aspecto crucial de la construcción de modelos de aprendizaje automático. Sin embargo, es importante tener en cuenta los factores anteriores para asegurarse de que el proceso de ajuste sea efectivo y conduzca a una mejora en el rendimiento del modelo.

Comments are closed.