Cómo grabar datos numéricos para bioestadística

Para los datos numéricos, la cuestión principal es cómo mucha precisión para grabar. Grabación de una variable numérica a tantos decimales como que tiene disponible es lo mejor.

Por ejemplo, si una escala puede medir el peso corporal a la más cercana 1/10 de un kilogramo, grabar en la base de datos a ese grado de precisión. Siempre se puede colofón al kilogramo más próximo después si usted quiere, pero nunca se puede "no redonda" un número para recuperar dígitos que no registró en el primer lugar.

Pero no se vaya por la borda en esta dirección - no registrar el índice de masa corporal de una persona (IMC) como 28.648832 kilogramos / metro cuadrado, incluso si su calculadora produce el resultado de tal precisión ridículo.

En la misma línea, haga datos numéricos no de grupo en intervalos durante la grabación de la misma. Si conoces a la edad de una persona en años, y luego grabarlo como el número real de años- no grabar en intervalos de 10 años (0 a 9, 10 a 19, y así sucesivamente). Siempre se puede tener el ordenador haga ese tipo de agrupación intervalo más tarde, pero nunca se puede recuperar la edad en años si todo lo que grabó fue la década.

Algunos programas le permiten elegir entre varias formas de representar internamente el número en el ordenador. El programa puede referirse a estos diferentes modos de almacenamiento utilizando términos arcanos como corto, largo o muy largo enteros (números enteros) o precisión simple (corto) o Doble precisión (largo) punto flotante números (fraccionarios). Cada tipo tiene sus propios límites, que pueden variar de un programa a otro o de un tipo de equipo a otro.

Por ejemplo, un entero corto podría ser capaz de representar sólo números enteros en el rango -32768 a 32.767, mientras que el número de coma flotante de doble precisión podría fácilmente manejar un número como 1.23456789012345 x 10250.

En los viejos tiempos, la elección juiciosa de los modos de almacenamiento para sus variables podría producir archivos más pequeños y dejar que el programa funcione con más asignaturas o más variables. Hoy en día, el almacenamiento es mucho menos de un problema de lo que solía ser, así que pellizcar peniques esta manera ofrece poco beneficio.

Ir a la representación numérica más general disponible - por lo general de doble precisión de punto flotante, que puede representar casi cualquier número puede jamás encontrada en su investigación.

Aquí hay un par de cosas a tener en cuenta cuando se introducen datos numéricos en Excel:

  • No ponga dos números (como una lectura de presión arterial de 135/85 mmHg) en una columna de datos. Excel no se quejará al respecto, pero lo tratará como texto debido a la incrustado "/", en lugar de datos numéricos. En su lugar, cree dos variables separadas - como las presiones sistólica y diastólica (quizá llamadas BPS para presión arterial sistólica y BPD para la presión arterial diastólica) - Y entre cada número en la variable correspondiente.

  • En una base de datos obstétricos, no entre en 6w2d para una edad gestacional de 6 semanas y 2 días- incluso peor, no entrará en él como 6,2, que el equipo interpretaría como 6.2 semanas. Cualquiera de introducirlo como 44 días, o crear dos variables (tal vez Gawks para semanas de edad gestacional y GAdays para días de edad gestacional), Para contener los valores 6 y 2, respectivamente.

    El ordenador puede combinar fácilmente más tarde en el número de días o el número de semanas (y fracciones de semana).

Hay una importante excepción a esta "no meter dos cosas en una columna" regla - Si está grabando tanto la fecha y hora de un solo evento (como "nacido el 15 de febrero de 2006, a las 8:56 de la tarde" ), entonces tú debería registrar la fecha y la hora como una sola variable! Ver el artículo sobre Introducción de datos de fecha y hora para obtener más detalles.

Faltan datos numéricos requiere un poco más de pensamiento que faltan datos categóricos. Algunos investigadores utilizan 99 (o 999, o 9999) para indicar un valor perdido. Si utiliza esta técnica, usted tiene que asegurarse de que todos sus análisis ignoran esos valores. Afortunadamente, muchos programas de estadísticas permiten especificar lo que el indicador de valor que falta es para cada variable, y los programas no incluyen aquellos valores de todos los análisis.

Pero, ¿puede usted De Verdad estar seguro de que va a nunca tiene ese valor pop-up como un valor real para algún tema muy atípica? (Algunas personas son de 99 años de edad, y algunas personas poder tener un valor de glucosa en sangre de 999 mg / dL). Simplemente dejando en blanco la célula puede ser mejor- casi todos los programas de tratamiento de células en blanco como los datos que faltan y los ignoran en los cálculos.




» » » » Cómo grabar datos numéricos para bioestadística