¿Cómo decidir si desea mantener los valores atípicos en el análisis predictivo

La decisión de incluir valores atípicos en el análisis - o excluirlos - tendrá implicaciones para su modelo de análisis predictivo. Mantener los valores atípicos como parte de los datos de su análisis puede conducir a un modelo que no es aplicable - ya sea para los valores atípicos o para el resto de los datos.

Si usted decide mantener un valor atípico, tendrás que elegir las técnicas y métodos estadísticos que tienen éxito en el manejo de los valores extremos sin influir en el análisis. Una de estas técnicas es el uso de funciones matemáticas tales como algoritmos naturales y raíz cuadrada para reducir la brecha entre los valores extremos y el resto de los datos.

Estas funciones, sin embargo, sólo funcionan para datos numéricos que es mayor que cero - y pueden surgir otros problemas. Por ejemplo, la transformación de los datos puede requerir interpretaciones de la relación entre las variables en los datos recién transformadas que difieren de la interpretación que gobierna las variables en los datos originales.

La mera presencia de valores atípicos en los datos puede proporcionar una visión de su negocio que pueden ser muy útiles en la generación de un modelo sólido. Outliers pueden llamar la atención sobre un caso de negocio válido que ilustra un evento significativo inusual poco.

Buscando valores atípicos, la identificación de ellos, y la evaluación de su impacto debe ser parte del análisis de datos y procesamiento previo. Expertos en los sectores de negocios pueden proporcionar información y ayudarle a decidir qué hacer con los casos inusuales en su análisis. Aunque el sentido común a veces es todo lo que necesita para hacer frente a los valores atípicos, a menudo es útil preguntar a alguien que conoce las cuerdas.

Si usted está en un negocio que se beneficia de eventos raros - por ejemplo, un observatorio astronómico con una beca para estudiar asteroides de órbita-cruzando la Tierra - que está más interesado en los valores extremos que en la mayor parte de los datos.

Los valores atípicos pueden ser una gran fuente de información. Desviarse de la norma podría ser una señal de actividad sospechosa, noticias de última hora, o un evento oportunista o catastrófico. Puede que tenga que desarrollar modelos que ayudan a identificar los valores atípicos y asnos los riesgos que significan.

Es prudente realizar dos análisis: uno que incluye los valores extremos, y otro que les omite. Luego de examinar las diferencias, tratar de entender las implicaciones de cada método, y evaluar cómo la adopción de un método sobre el otro influiría en sus objetivos de negocio.




» » » » ¿Cómo decidir si desea mantener los valores atípicos en el análisis predictivo