Cómo crear un diccionario de datos para describir sus datos bioestadística

Cada base de datos de la investigación, grande o pequeño, simple o complicada, debería ir acompañada de una Diccionario de datos que describe las variables contenidas en la base de datos. Será muy útil si la persona que creó la base de datos ya no es todo. Un diccionario de datos es, en sí, un archivo de datos, que contiene un registro para cada variable en la base de datos.

Para cada variable, el diccionario debe contener la mayor parte de la siguiente información (a veces referido como metadatos, que significa "datos sobre datos"):

  • Un corto nombre de variable (por lo general no más de ocho o diez caracteres) que se utiliza cuando se dice que el software lo que las variables que desea que utilice en un análisis

  • Una descripción verbal más larga de la variable (hasta 50 o 100 caracteres)

  • El tipo de datos (texto, categórica, numérico, fecha / hora, etc.)

  • Si numérico: Información sobre cómo se muestra ese número (cuántos dígitos son antes y después del punto decimal)

  • Si la fecha / hora: Cómo se formatea (por ejemplo, 12/25/13 22:50 o 25Dec2013 22:50)

  • Si categórica: Lo que las categorías son permisibles

  • ¿Cómo se representan los valores perdidos en la base de datos (99, 999, "NA", y así sucesivamente)

  • Muchos paquetes estadísticos permiten (o requieren) especificar esta información al crear el archivo de todos modos, por lo que puede generar el diccionario de datos de forma automática.

    Pero Excel le permite introducir cualquier cosa en cualquier lugar, sin definir formalmente las variables, por lo que necesita para crear el diccionario de ti mismo (quizás como otra hoja de cálculo - que se puede llamar "Diccionario de Datos" - en el mismo archivo de Excel que tiene los datos, por lo que los datos diccionario siempre permanece con los datos).




    » » » » Cómo crear un diccionario de datos para describir sus datos bioestadística