Fase 1 del modelo de proceso CRISP-DM: comprensión del negocio

los Cruz-industria de procesos estándar para la minería de datos

(CRISP-DM) Es el marco de proceso dominante para la minería de datos. En la primera fase de un proyecto de minería de datos, antes de acercarse a los datos o herramientas, defina lo que vas a lograr y definir las razones para querer lograr este objetivo.

La fase de comprensión del negocio incluye las cuatro tareas (actividades primarias, cada una de las cuales pueden involucrar varias partes más pequeñas).

Tarea: Identificar sus objetivos de negocio

La primera cosa que debe hacer en cualquier proyecto es averiguar exactamente lo que estamos tratando de lograr! Eso es menos evidente de lo que parece. Muchos mineros de datos han invertido tiempo en el análisis de datos, sólo para descubrir que su gestión no estaba particularmente interesado en el tema que estaban investigando. Usted debe comenzar con una clara comprensión de

  • Un problema que su administración quiere hacer frente a

  • Los objetivos de negocio

  • Restricciones (limitaciones sobre lo que puede hacer, el tipo de soluciones que se pueden utilizar, cuando el trabajo debe ser completado, y así sucesivamente)

  • Impacto (cómo el problema y las posibles soluciones encajan con el negocio)

Entregables para esta tarea incluyen tres artículos (por lo general breves informes centrados únicamente en los puntos principales):

  • Fondo: Explicar la situación de negocio que impulsa el proyecto. Este artículo, al igual que muchos que siguen, asciende sólo a unos pocos párrafos.

  • Metas de actividad: Definir lo que su organización pretende lograr con el proyecto. Esto suele ser un objetivo más amplio de lo que, como un minero de datos, se puede lograr de forma independiente. Por ejemplo, el objetivo de negocio podría ser la de aumentar las ventas de una campaña publicitaria de vacaciones en un 10 por ciento año tras año.

  • Criterios de éxito empresarial: Definir cómo se medirán los resultados. Trate de obtener criterios de éxito cuantitativos claramente definidos. Si tiene que utilizar criterios subjetivos (Sugerencia: términos como obtener conocimientos o conseguir una manija en implicar criterios subjetivos), por lo menos conseguir un acuerdo sobre exactamente quién va a juzgar si se han cumplido esos criterios.

Tarea: Evaluación de su situación

Aquí es donde usted entra en más detalles sobre las cuestiones relacionadas con sus objetivos de negocio. Ahora vas a profundizar en la determinación de hechos, la construcción de una explicación mucho más carnoso de las cuestiones esbozadas en la tarea objetivos de negocio.

Entregables para esta tarea incluyen cinco informes en profundidad:

  • Inventario de recursos: Una lista de todos los recursos disponibles para el proyecto. Estos pueden incluir personas (mineros no sólo datos, sino también a los que tienen el conocimiento experto del problema de negocio, administradores de datos, soporte técnico, y otros), datos, hardware y software.

  • Requisitos, suposiciones y restricciones: Requisitos incluirán un calendario para la terminación, obligaciones legales y de seguridad, y los requisitos para el trabajo terminado aceptable. Este es el punto para verificar que usted tendrá acceso a los datos apropiados!

  • Riesgos y contingencias: Identificar las causas que podrían retrasar la finalización del proyecto, y preparar un plan de contingencia para cada uno de ellos. Por ejemplo, si un apagón de Internet en su oficina podría plantear un problema, tal vez su contingencia podría ser trabajar en otro cargo hasta el apagón ha terminado.

  • Terminología: Crear una lista de términos de negocio y los términos de minería de datos que son relevantes para su proyecto y se anota en un glosario con las definiciones (y quizás los ejemplos), por lo que todos los involucrados en el proyecto puede tener un entendimiento común de esos términos.

  • Costos y beneficios: Preparar un análisis de costo-beneficio para el proyecto. Trate de indicar todos los costos y beneficios de dólar (euro, libra, yen, etc.) Los términos. Si los beneficios no superan significativamente los costos, parar y reconsiderar este análisis y su proyecto.

Los tomadores de decisiones a menudo se sienten más cómodos asignando recursos a proyectos que reducen los costos que los que tienen como objetivo aumentar los ingresos, por lo que siempre busca el potencial de ahorro de costos y oportunidades de ahorro del Estado por primera vez en su informe de costos y beneficios.

Tarea: La definición de sus objetivos de minería de datos

Llegar a la meta de negocio a menudo requiere de la acción de muchas personas, no sólo el minero de datos. Así que ahora, debe definir su pequeña parte dentro de la imagen más grande. Si el objetivo de negocio es reducir la pérdida de clientes, por ejemplo, sus objetivos de minería de datos podría ser la de identificar las tasas de deserción de varios segmentos de clientes, y desarrollar modelos para predecir qué clientes están en mayor riesgo.

Entregables para esta tarea incluyen dos informes:

  • Datos objetivos de la minería: Definir los entregables de minería de datos, como los modelos, informes, presentaciones y bases de datos procesados.

  • Criterios de éxito de Datos-extracción: Definir los criterios técnicos de minería de datos necesarios para apoyar los criterios de éxito de negocio. Intenta definir estos en términos cuantitativos (como la exactitud del modelo predictivo o mejora en comparación con un método existente). Si los criterios deben ser cualitativa, identificar a la persona que hace la evaluación.

Tarea: Producir el plan del proyecto

Ahora se especifica en cada paso que usted, el minero de datos, tiene la intención de tomar hasta que el proyecto se ha completado y los resultados se presentan y revisado.

Entregables para esta tarea incluyen dos informes:

  • Plan de proyecto: Esquema de su plan de acción paso a paso para el proyecto. Expandir el contorno con un calendario para la finalización de cada etapa, los recursos necesarios, los insumos (por ejemplo, datos o una reunión con un experto en la materia) y salidas (como los datos limpiados, un modelo o un informe) para cada paso, y dependencias (pasos que no pueden comenzar hasta que se complete este paso). Explícitamente afirman que ciertos pasos deben repetirse (por ejemplo, el modelado y la evaluación general llame para varias repeticiones espalda y adelante).

  • Evaluación inicial de herramientas y técnicas: Identificar las capacidades necesarias para cumplir con sus objetivos de minería de datos y evaluar las herramientas y recursos que tiene. Si falta algo, usted tiene que resolver ese problema muy temprano en el proceso.




» » » » Fase 1 del modelo de proceso CRISP-DM: comprensión del negocio