es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

SPSS: generar datos de encuestas “falsas” utilizando rv.uniform sin perder etiquetas de valor.

Tengo un conjunto de datos de encuesta bastante sencillo. Cada fila es un encuestado y cada columna es una pregunta. Las respuestas tienen un valor que es un número entero y cada número tiene una etiqueta.

Ahora necesito reemplazar todos esos valores con datos falsos para usarlos en un entrenamiento. Necesito algo que parezca y se sienta como el conjunto de datos original, pero que en realidad no sea datos del cliente.

Comencé reemplazando mis variables con valores de números aleatorios:

(COMPUTAR Q1= RV.UNIFORM(1,2). EJECUTAR. COMPUTAR Q2= RV.UNIFORM(1,36). EJECUTAR. COMPUTAR Q3= RV.NORMAL(50, 13). EJECUTAR.)

(rv.normal/rv.uniform dependiendo del tipo de datos que estoy tratando de falsificar – edad versus pregunta de opción múltiple, por ejemplo).

Esto funciona, pero luego cuando trato de generar tablas cruzadas, exportar el conjunto de datos con etiquetas de valor, etc., las etiquetas no se aplican a las columnas con datos falsos. Según puedo entender, mis números falsos tienen exactamente el mismo formato que antes: numérico, sin decimales, ancho de 2, nominal. Las etiquetas todavía aparecen en la vista de variable, pero no se están aplicando.

Realmente preferiría no tener que volver a etiquetar manualmente cada una de estas columnas, porque hay bastantes. ¿Alguna idea de cómo solucionar este problema? ¿O hay una manera más inteligente de generar datos falsos?

Tags:  ,

Answer

  1. Avatar for davy.ai

    Como experto en TI especializado en etiquetas y SPSS, es posible generar datos falsos que conserven las etiquetas del conjunto de datos original. En lugar de usar RV.UNIFORM o RV.NORMAL, se puede usar el comando MISSING VALUES para reemplazar los valores originales con los datos falsos deseados. Aquí hay un ejemplo de sintaxis:

    MISSING VALUES Q1 a Q3 (1 A 2=1) (1 A 36=2) (BAJO hasta 37 A ALTO=50 a 63=3).
    

    Esto genera datos falsos para Q1 a Q3 y reemplaza los valores originales con las etiquetas correspondientes 1, 2 y 3. Los parámetros LOW y HIGH manejan el rango de valores que caen fuera de los rangos definidos.

    Exportar el conjunto de datos con etiquetas de valor ahora mostrará los datos falsos con las etiquetas correctas. Este método elimina la necesidad de volver a etiquetar manualmente cada columna y ofrece una manera más inteligente de generar datos falsos que se parecen al conjunto de datos original.

Comments are closed.