Recodificación automática en SPSS Statistics
En IBM SPSS Statistics, la gente con frecuencia tienen las variables categóricas con una gran cantidad de valores. No es raro que estos datos han sido introducidos como valores de cadena - caracteres alfanuméricos. Usted realmente debe evitar alfanuméricos, sin embargo, y no hay una forma sencilla de hacer que los datos mejores: el comando Recodificación automática.
Consideremos el ejemplo de una simple lista de nombres de frutas introducidos en una hoja de cálculo:
manzana |
Plátano |
Cantalupo |
durian |
lúcuma |
higo |
pomelo |
arándano |
La mayoría de los menús se encargará de estas variables, pero otras no. Estas variables tienen una pequeña carta la al lado de sus símbolos de variables en los menús para recordarle que hayan sido declarados una cadena en la Vista de variables. Por lo general, este tipo de listas pueden ser nombres de productos, nombres de clientes, coche marcas y modelos, y así sucesivamente.
Grandes conjuntos de datos complejos, casi siempre tienen estos puntos de datos pareados con los códigos numéricos. A veces, sin embargo, no cuenta con un esquema de codificación y que estés tentado a sólo tienes que escribir en las palabras. No es Buena idea. Hay por lo menos cuatro razones por las que no debes hacer esto:
Algunos menús de SPSS no les gusta variables alfanuméricas, y usted puede preguntarse donde la variable fue. Estas variables ni siquiera van a aparecer en algunas listas de variables.
Cuerdas en SPSS entre mayúsculas y minúsculas por lo " fig, " " la figura, " y " fig " se cuenta como tres frutas diferentes. No es bueno.
Tal vez lo peor de todo, los espacios antes o después de la palabra puede causar problemas. Así " Fig, " " fig, " y " Figura " podrían todos se considerarán diferentes frutas. Usted puede no notar estos espacios en un primer momento, lo que hace que sea aún peor.
Faltan datos manejo con caracteres alfanuméricos es confuso. Así " " se podría considerar su propio fruto. También no es bueno.
Pero esta situación no tiene por qué ser difícil, incluso si tiene docenas o cientos de nombres que tratar. Para acceder Recodificación automática, seleccione el menú Transformar, y luego elegir Recodificación automática. Un ejemplo del diálogo completo se muestra en la figura siguiente. Tenga en cuenta las Cuerdas en blanco Tratar casilla perdidos por el usuario como. Comprobar que la caja es casi siempre una buena idea. Note, también, que un nuevo nombre se debe proporcionar para la nueva variable que está a punto de crear.
Si se va a ejecutar el ejemplo anterior, el siguiente podría aparecer en la ventana de salida:
fruta en fruit_numOld Valor Valor nuevo Valor Labelapple 1 applebanana2 canteloupedurian4 bananacanteloupe3 durianeggfruit 5 eggfruitfig 6 figgrapefruit7 grapefruithuckleberry 8 huckleberry
SPSS ha creado una nueva variable para usted que ya no tiene caracteres alfanuméricos. En cambio ahora tienes una nueva variable que tiene valores numéricos con las etiquetas de valores que muestran los valores originales. Por lo tanto, si usted tiene este tipo de variables, no hay realmente ninguna excusa para no usarlo. Trate de deshacerse de esas variables alfanuméricas!