Después de la ajuste de hiperparámetros, la precisión permanece igual.
Estaba intentando ajustar los parámetros, pero después de hacerlo, la puntuación de precisión no ha cambiado en absoluto, ¿qué estoy haciendo mal?
# Log reg
from sklearn.linear_model import LogisticRegression
logreg = LogisticRegression(C=0.3326530612244898, max_iter=100, tol=0.01)
logreg.fit(X_train, y_train)
from sklearn.metrics import confusion_matrix
y_pred = logreg.predict(X_test)
print('La precisión de la regresión logística es:', logreg.score(X_test, y_test))
confusion_matrix(y_test, y_pred)
# 0,9181286549707602 - precisión antes de ajustar
Resultado:
La precisión de la regresión logística es: 0.9181286549707602
array([[54, 9],
[5, 103]])
Aquí estoy usando Grid Search CV:
from sklearn.model_selection import GridSearchCV
params = {'tol': [0.01, 0.001, 0.0001],
'max_iter': [100, 150, 200],
'C': np.linspace(1, 20) / 10}
grid_model = GridSearchCV(logreg, param_grid=params, cv=5)
grid_model_result = grid_model.fit(X_train, y_train)
print(grid_model_result.best_score_, grid_model_result.best_params_)
Resultado:
0.8867405063291139 {'C': 0.3326530612244898, 'max_iter': 100, 'tol': 0.01}
davy.ai
Parece que has ajustado los hiperparámetros de tu modelo de regresión logística usando GridSearchCV, pero la puntuación de precisión no ha mejorado. Aquí hay algunas razones por las que esto podría haber sucedido:
Sobreajuste: si el rango de parámetros se establece demasiado amplio, puede provocar sobreajuste en los datos de entrenamiento. En ese caso, el modelo podría funcionar bien en los datos de entrenamiento, pero no en los datos de validación o prueba. Para evitar el sobreajuste, es importante establecer rangos realistas para los parámetros y usar la validación cruzada para estimar el rendimiento.
Calidad de los datos: el rendimiento de los modelos de aprendizaje automático está estrechamente relacionado con la calidad de los datos. Si los datos son ruidosos o incompletos, puede afectar negativamente el rendimiento del modelo.
Otros problemas algorítmicos: Finalmente, puede haber otros problemas específicos del algoritmo utilizado. Por ejemplo, algunos algoritmos como la regresión logística pueden requerir ciertas configuraciones de parámetros para funcionar mejor. Por lo tanto, es importante comprender bien el algoritmo y elegir la configuración de parámetros en consecuencia.
En resumen, la sintonización de hiperparámetros es un aspecto crucial de la construcción de modelos de aprendizaje automático. Sin embargo, es importante tener en cuenta los factores anteriores para asegurarse de que el proceso de ajuste sea efectivo y conduzca a una mejora en el rendimiento del modelo.