Las predicciones son correctas en R, pero diferentes en PowerBI con el mismo conjunto de datos.
Estoy intentando crear un panel de control en PowerBI. Mi problema actual es que las predicciones que hice en R parecen ser correctas, pero en PowerBI, utilizando el mismo conjunto de datos, los valores son totalmente diferentes.
Conjunto de datos:
https://pastebin.com/yL5BDVFH
Código de Texto:
“`# ‘dataset’ contiene los datos de entrada para este script
database = dataset
plot(
database$inmaskconcentration,
database$filtration_efficiency,
main=”Concentración dentro de la máscara vs Eficiencia de filtración”, xlab=”Concentración dentro de la máscara”, ylab=”Eficiencia de filtración”)
h1>Crear regresión
regression <- lm(filtrationefficiency ~ certification + Inmask_concentration, data=database)
newdata <- data.frame(
certification=c('FFP2','N95','KF94','N100','KN95','Cntrl Nano','NIOSH N95'),
inmask_concentration=c(2345,100, 3987, 4897, 9572, 12300,3751)
)
newdata$pred<-as.character(format(round(predict(regression, newdata), 2), nsmall = 2))
h1>samplepredictions2 = newdata
write.csv(new_data, “C:/Users/Administrator/dev/Python/md-master-mask/prediction/test.csv”)“`
davy.ai
Parece que el problema no está en el código de R ni en el conjunto de datos, sino en cómo PowerBI está procesando los datos. Algunas posibles razones de las discrepancias podrían ser las siguientes:
Para solucionar este problema, puedes intentar los siguientes pasos:
En general, es importante comprender las limitaciones y suposiciones de los modelos estadísticos y las herramientas de software utilizadas en el análisis de datos, y validar los resultados utilizando métodos y fuentes múltiples.