¿Tramas extrañas al trazar los residuos de la regresión logística frente a las variables predictoras?

17 Jul, 2023 Programación 0

He realizado una regresión logística para un resultado (un tipo de efecto secundario – si los pacientes lo tienen o no). La fórmula y los resultados de este modelo se muestran a continuación:

modelo <- glm(side<em>effect</em>G1 ~ edad + bmi + tipoCirugía1 + tipoCirugía2 + tipoCirugía3 + cvd + rt_áxila, family = 'binomial', data = datos1)

Coeficientes:
                       Estimado Error estándar Valor-z Valor-p
(Intercepto)           -7.888112   0.859847  -9.174  < 2e-16 <strong>*
edad                    0.028529   0.009212   3.097  0.00196 <em>* 
bmi                    0.095759   0.015265   6.273 3.53e-10 *</em></strong>
cirugía1              0.923723   0.524588   1.761  0.07826 .<br>
cirugía2              1.607389   0.600113   2.678  0.00740 * 
cirugía3              1.544822   0.573972   2.691  0.00711 ** 
cvd1                   0.624692   0.290005   2.154  0.03123 *<br>
rt1                    -0.816374   0.353953  -2.306  0.02109 *<br>

Quiero revisar mis modelos, así que he representado los residuos frente a los predictores o los valores ajustados. Sé que, si un modelo está ajustado correctamente, no debería haber correlación entre los residuos y los predictores y valores ajustados, así que básicamente ejecuto…

residualPlots(modelo)

Mis gráficos se ven extraños porque, según lo que he visto en ejemplos en línea, deberían ser simétricos alrededor de 0. Además, mis variables de factor no se muestran en los diagramas de caja a pesar de que he verificado la estructura de mis datos y codificado cirugía1, cirugía2, cirugía4, cvd, rt como factores. ¿Alguien puede ayudarme a interpretar mis gráficos y guiarme sobre cómo trazar diagramas de caja para mis variables de factor?

Enlace a la imagen del gráfico

Gracias.

davy.ai

July 17, 2023 at 1:00 pm

Parece que puede haber algunos problemas con el ajuste del modelo, ya que los gráficos de residuos no parecen ser simétricos alrededor de cero. Esto podría indicar que todavía hay algunos patrones o relaciones en los datos que el modelo no ha capturado.

Para graficar los diagramas de caja para las variables de factor, puedes usar la función plot() con la variable de factor como eje x y los residuos como eje y. Por ejemplo:

plot(data1$surgerytype1, residuals(model))
plot(data1$cvd, residuals(model))
plot(data1$rt_axilla, residuals(model))

Esto te dará gráficos separados para cada variable de factor, mostrando la distribución de los residuos para cada nivel del factor. Si hay algún patrón o relación en los datos que el modelo no ha capturado, es posible que puedas verlo en los diagramas de caja.

También es importante verificar que las variables de factor se hayan codificado correctamente como factores en los datos. Puedes utilizar la función str() para verificar la estructura de los datos y asegurarte de que las variables de factor estén listadas como factores.

En general, podría valer la pena explorar otros modelos o ajustes al modelo actual para intentar mejorar el ajuste y capturar de mejor manera cualquier patrón o relación en los datos.

Answer

davy.ai

July 17, 2023 at 1:00 pm
Parece que puede haber algunos problemas con el ajuste del modelo, ya que los gráficos de residuos no parecen ser simétricos alrededor de cero. Esto podría indicar que todavía hay algunos patrones o relaciones en los datos que el modelo no ha capturado.

Para graficar los diagramas de caja para las variables de factor, puedes usar la función plot() con la variable de factor como eje x y los residuos como eje y. Por ejemplo:
```
plot(data1$surgerytype1, residuals(model))
plot(data1$cvd, residuals(model))
plot(data1$rt_axilla, residuals(model))
```
Esto te dará gráficos separados para cada variable de factor, mostrando la distribución de los residuos para cada nivel del factor. Si hay algún patrón o relación en los datos que el modelo no ha capturado, es posible que puedas verlo en los diagramas de caja.

También es importante verificar que las variables de factor se hayan codificado correctamente como factores en los datos. Puedes utilizar la función str() para verificar la estructura de los datos y asegurarte de que las variables de factor estén listadas como factores.

En general, podría valer la pena explorar otros modelos o ajustes al modelo actual para intentar mejorar el ajuste y capturar de mejor manera cualquier patrón o relación en los datos.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

¿Tramas extrañas al trazar los residuos de la regresión logística frente a las variables predictoras?

Answer

davy.ai