es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Cómo centrar la variable de respuesta y la variable predictor (centrar en la media) utilizando la tabla resumen?

no tenemos los datos solo se presenta la tabla de resumen

Estimación Error estándar valor t Pr(>|t|)
(Intercepto) -36.8522 12.6560 -2.912 0.005573 **
X1 -0.7120 1.4540 -0.490 0.626747

---
Códigos de signficancia:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Error estándar residual: 12.27 con 45 grados de libertad
R-cuadrado múltiple:  0.7377,    R-cuadrado ajustado:  0.7144 
Estadístico F: 31.63 con 4 y 45 DF,  valor p: 1.478e-12

Sé que para el centrado, necesito centrar la variable predictora para que esté centrada en la media y tenga nuevos valores, es decir que toda la escala se haya desplazado de manera que la media ahora tenga un valor de 0. Y sé que el intercepto cambiará, pero el coeficiente de regresión para esa variable no lo hará.

Tags:  , ,

Answer

  1. Avatar for davy.ai

    Sin tener los datos reales, es difícil interpretar completamente la tabla de resumen. Sin embargo, se pueden hacer algunas observaciones.

    La tabla de resumen muestra los coeficientes estimados de un modelo de regresión lineal. Se estima que la intersección es -36.8522, con un error estándar de 12.6560. El coeficiente para la variable predictor X1 se estima en -0.7120, con un error estándar de 1.4540.

    La siguiente sección de la tabla proporciona información sobre la significancia de los coeficientes. Los tres asteriscos para la intersección indican que tiene una significancia estadística al nivel del 0.1% (es decir, un valor p < 0.001). Sin embargo, el coeficiente para X1 no es significativo a ningún nivel convencional de significancia (es decir, un valor p > 0.05).

    La tabla de resumen también proporciona información sobre la bondad del ajuste del modelo. Se estima que el error estándar residual (RSE, por sus siglas en inglés) es de 12.27, lo que indica la diferencia promedio entre los valores observados y los valores predichos de la variable de respuesta. El coeficiente de determinación múltiple (R-cuadrado ajustado) es de 0.7377, lo que significa que las variables predictoras incluidas en el modelo explican el 73.77% de la variabilidad de la variable de respuesta. El R-cuadrado ajustado es de 0.7144, que es una versión modificada del R-cuadrado que tiene en cuenta el número de variables predictoras y el tamaño de muestra. El estadístico F prueba la significancia global del modelo y se calcula dividiendo la variación explicada por la variación no explicada. En este caso, el estadístico F es de 31.63, con 4 y 45 grados de libertad, y el valor p es muy pequeño (1.478e-12), lo que indica una fuerte evidencia en contra de la hipótesis nula de ausencia de relación entre las variables predictoras y la variable de respuesta.

    En cuanto a la centralización de la variable predictor, la centralización no cambia el coeficiente de regresión, pero sí cambia la intersección. Centralizar la variable predictor en su media crea una intersección que representa el valor predicho de la variable de respuesta cuando la variable predictor está en su valor medio.

Comments are closed.