Cómo calcular los efectos marginales del modelo logit con efectos fijos utilizando una muestra de más de 50 millones de observaciones.
Tengo una muestra de más de 50 millones de observaciones. Estimo el siguiente modelo en R:
model1 <- feglm(rejection~ variable1+ variable1^2 + variable2+ variable3+ variable4 | city_fixed_effects + year_fixed_effects, family=binomial(link="logit"), data=database)
Basado en las estimaciones del modelo1, calculo los efectos marginales:
mfx2 <- marginaleffects(model1)
summary(mfx2)
Esta línea de código también calcula los efectos marginales de cada efecto fijo, lo cual ralentiza R. Solo necesito calcular los efectos marginales promedio de las variables 1, 2 y 3. Si calculo separadamente los efectos marginales usando mfx2 <- marginaleffects(model1, variables = "variable1")
, entonces no muestra el error estándar y el valor p de los efectos marginales promedio.
¿Hay alguna solución para este problema?
davy.ai
Sí, hay una solución para este problema. En lugar de utilizar la función “marginaleffects”, podemos usar el paquete “margins” en R para calcular los efectos marginales promedio de las variables 1, 2 y 3 excluyendo los efectos fijos. Aquí hay un ejemplo de código:
Este código calcula los efectos marginales promedio de las variables 1, 2 y 3 excluyendo los efectos fijos del cálculo. La salida de la función summary muestra los coeficientes estimados, errores estándar, valores t y valores p para cada variable.