es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

¿Cómo se prueba la significancia de los parámetros estimados de regresión (ajuste de datos)?

Hice un modelo de regresión que intenta ajustar mis datos (x: año, y: número de coches). Y ahora me siento frustrado. ¿Cómo evaluar si los parámetros estimados (p = 0,0001695867, q = 0,349592505) son significativos? ¿Cómo realizar algunas pruebas estadísticas (estimar valores p para ambos p y q, estadísticas t) para probar la significancia de p y q? Y tal vez una prueba F de significancia general en el análisis de regresión. Por alguna razón, no estoy interesado en encontrar intervalos de confianza para p y q. Pero los valores p o estadísticas t o lo que sea son de mayor interés para mí para calcular. Entonces,

Ho: p estadísticamente no significativo H1: p estadísticamente significativo. Lo mismo para q.

Y una prueba F:

Ho: p y q = 0 al mismo tiempo. H1: ya sea p o q no es igual a 0.

import pandas as pd
x = pd.read_excel(‘datos_ajuste.xlsx’, sheet_name=”bevshyb cars (2)”, index_col=None, dtype={‘Nombre’: str, ‘Valor’: float})
import numpy as np
#función de regresión
def ajuste(t,p,q):
return 22500000(((ppp+2ppq+pqq)np.exp(-pt-qt))/(((p+qnp.exp(-pt-qt))(p+qnp.exp(-pt-qt)))))
#valores iniciales
g = [0,000001,0,000001]
import scipy.optimize
t = x[‘t’].values
coches_actuales = x[‘BEVSHYB’].values
c, cov = scipy.optimize.curve_fit(ajuste,t,coches_actuales,g)
print(round(c[0],10))
print(round(c[1],10))

Parámetros estimados: p y q respectivamente == 0,0001695867, 0,349592505

import sklearn.metrics
print(‘R^2: ‘,sklearn.metrics.r2_score(x[‘BEVSHYB’],y))
print(‘explained_variance_score: ‘, sklearn.metrics.explained_variance_score(x[‘BEVSHYB’], y))

Evaluación de la bondad de ajuste en el modelo de regresión:
R^2: 0,9143477744061798
explained_variance_score: 0,9168457427666166

Cualquier ayuda será apreciada)))

Tags:  , , , ,

Answer

  1. Avatar for davy.ai

    Para probar la significancia de los parámetros estimados en el modelo de regresión, podemos calcular los valores p y las estadísticas t tanto para p como para q. Para ello, podemos seguir los siguientes pasos:

    1. Encontrar los residuos (la diferencia entre los valores reales y los valores predichos) del modelo de regresión.
    2. Calcular los grados de libertad (gl) como el número de puntos de datos (n) menos el número de parámetros estimados (p).

    3. Calcular el error estándar residual (RSE) como la raíz cuadrada de la suma de los residuos cuadrados (SSR) dividida por (n-p-1).

    4. Calcular las estadísticas t como los parámetros estimados (p o q) divididos por su error estándar, que equivale a la raíz cuadrada de los elementos diagonales de la matriz de covarianza multiplicada por RSE.

    5. Calcular los valores p para las estadísticas t utilizando la función de distribución acumulada (CDF) de la distribución t con gl grados de libertad.

    6. Comparar los valores p con un nivel de significancia elegido (por ejemplo, 0,05) para determinar si los parámetros estimados son estadísticamente significativos.

    Para realizar la prueba F de significancia global, podemos seguir los siguientes pasos:

    1. Calcular la suma de los residuos cuadrados (SSR) y la suma total de cuadrados (SST) como la suma de las diferencias cuadradas entre los valores reales y la media de los valores reales.
  2. Calcular los grados de libertad para SST como n-1.

  3. Calcular los grados de libertad para SSR como n-p-1.

  4. Calcular el error cuadrático medio (MSE) como SSR/gl(SSR).

  5. Calcular el error cuadrático total medio (MST) como SST/gl(SST).

  6. Calcular la estadística F como MSE/MST.

  7. Calcular el valor p para la estadística F utilizando la CDF de la distribución F con gl (SSR) y gl (SST) grados de libertad.

  8. Comparar el valor p con un nivel de significancia elegido (por ejemplo, 0,05) para determinar si el modelo de regresión es estadísticamente significativo.

  9. Tenga en cuenta que si no estamos interesados ​​en calcular intervalos de confianza para p y q, podemos saltar el paso de calcular el error estándar de los parámetros estimados.

    En resumen, podemos utilizar pruebas estadísticas como las pruebas t y F para evaluar la significancia de los parámetros estimados y el ajuste general del modelo de regresión.

Comments are closed.