Datos de muestra: A <- data.frame(region = c("US","US", "UK","UK","AUS","AUS"), a = c(1,2,3,4,5,8), b = c(4,5,6,7,8,2), c = c(9,6,5,43,2,5)) B <- data.frame(region = c("US","US", "UK","UK","AUS","AUS"),a = c(7,4,3,6,9,81), b = c(9,4,3,7,0,35), c = c(22,5,6,2,9,33)) Resultado esperado: (x es la correlación para la columna entre dos data frames en la región) He intentado: . . . Read more
Soy nuevo en la programación en general, así que perdóneme si la pregunta es bastante básica. Estoy tratando de determinar los valores de p, d, q para un modelo ARIMA y ya he realizado una prueba de adfuller que determinó que mi serie de tiempo es estacionaria. Sin embargo, cuando . . . Read more
Estoy escribiendo un código de preprocesamiento para mi entrenamiento de LSTM. Mi archivo CSV contiene más de 30 variables. Después de aplicar algunas técnicas de EDA, descubrí que se pueden eliminar la mitad de las características y no tienen ningún efecto en el entrenamiento. Actualmente estoy eliminando manualmente estas características . . . Read more
Quiero obtener todos los nombres de las columnas cuya correlación sea mayor a 0.2 y menor que 0.8. ¿Existe alguna forma de hacer esto?
¿Cómo podemos comparar una variable que tiene muchos valores con un valor que vamos a parametrizar? Consideremos: Nombre de la variable: City Mientras se realiza la correlación estamos capturando todas las ciudades en una página usando -1 Captura todos los nombres de ciudades como: City1:* City2:* City3:* CityN:* El número . . . Read more