Cómo entrar en la fecha y hora de datos de bioestadística

Al introducir datos numéricos en el ordenador, don't combinar dos números en una sola variable (como 145/85 para la presión arterial sistólica y diastólica). Cuando se trata de fechas y horas, sin embargo, todo lo contrario es cierto!

La mayoría del software estadístico puede representar fechas y horas como una sola variable (una "instantánea" en una línea de tiempo continuo), a fin de tomar ventaja de que si se puede - introduzca la fecha y el tiempo como una variable (por ejemplo, 07/15/2010 08 : 23), no como una variable de fecha y una variable de tiempo.

Este método es especialmente útil cuando se trata de eventos que tienen lugar durante un corto intervalo de tiempo (como los eventos que ocurren durante el parto).

La mayoría estadística actualizada programas tienda y tiempo internamente como un número, que especifica el número de días (y fracciones de días) de algunos arbitraria "fecha cero". Aquí están las fechas cero para algunos programas comunes:

  • Excel: Medianoche en el inicio del 31 de diciembre 1899 (esto también es la fecha más temprana que Excel puede almacenar). Así 21 de noviembre 2012, a las 6:00 pm, se almacena internamente como 41,234.75 (la 0.75 se debe a 18:00 es 3/4 del camino a través de ese día).

  • SPSS: 14 de octubre 1582 (fecha en que se adoptó el calendario gregoriano para reemplazar el calendario juliano).

  • SAS: 01/01/1960 (una fecha totalmente arbitraria).

Algunos programas pueden almacenar una fecha y hora como Fecha Juliana, cuya cero ocurrido al mediodía, hora de Greenwich, el 1 de enero de 4713 antes de Cristo. (Nada especial sucedió en esa fecha- "que originalmente fue elegido puramente una conveniencia numérico.)

¿Qué pasa si usted no sabe el día del mes? Esto sucede mucho con la historia médica de los items que oiga algo así como "Tengo la gripe en septiembre de 2004." La mayoría del software insiste en que una variable de fecha sea una fecha completa y no aceptará sólo un mes y un año.

En este caso, un argumento puede ser hecho para establecer el día y el 15 (a mediados de mes), en razón de que es la misma probabilidad de estar en cualquier lado el error y por lo tanto tiende a anular, en promedio. Del mismo modo, si tanto el mes y el día se pierden, se puede establecer que el 30 de junio o el 1 de julio (a mediados de año) para lograr el mismo tipo de cancelación promedio de error.

Si sólo algunos registros tienen fechas parciales, es posible que desee crear otra variable para indicar si la fecha es total o parcial, así que usted puede decir, si es necesario, si realmente 09/15/2004 medios 15 de septiembre de 2004 o simplemente septiembre de 2004.

Completamente fechas que faltan por lo general sólo se debe dejar blanking mayoría trata de software estadístico células blanco de datos que faltan.

Debido a la forma en la mayoría de los programas de estadísticas almacenar fechas y horarios, se pueden calcular fácilmente los intervalos entre dos puntos en el tiempo por lo que se llama "la aritmética de calendario", lo que podría indicar como una simple resta. Así que por lo general es más fácil y más seguro para entrar en las fechas y horas y dejar que el ordenador calcular los intervalos entre ellos que para calcular los intervalos de ti mismo.

Por ejemplo, si crea las variables de la fecha de nacimiento (Fecha de Nacimiento) Y una fecha de visita (VisDt) en Excel, a menudo puede haber Excel calcular una muy precisa edad en el momento de la visita con esta sencilla fórmula:

Años = (VisDt - Fecha de Nacimiento) /365.25

Del mismo modo, en estudios de cáncer, se puede calcular fácilmente y con precisión los intervalos de diagnóstico o tratamiento a la remisión y recurrencia, así como el tiempo total de supervivencia, de las fechas de los eventos correspondientes.




» » » » Cómo entrar en la fecha y hora de datos de bioestadística