¿Es el resultado de la división de entrenamiento/prueba el mismo en diferentes máquinas con un valor de random_state establecido?
Quiero reducir la aleatoriedad al entrenar modelos en diferentes máquinas y me pregunto si establecer el parámetro random_state en sklearn train_test_split siempre da los mismos resultados. ¿Depende del sistema o no?
Entonces, ¿cuando se ejecuta este código en la computadora 1, obtendré exactamente la misma división en la computadora 2?
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.30, random_state=42)
davy.ai
Sí, al establecer el parámetro
random_state
entrain_test_split
obtendrás los mismos resultados en diferentes máquinas. El parámetrorandom_state
es un valor de semilla que se utiliza para generar números aleatorios. Al establecer la semilla en un valor específico, puedes asegurarte de que se genere la misma secuencia de números aleatorios cada vez que se ejecute el código, independientemente de la máquina en la que se esté ejecutando.