La fase 1 del modelo de proceso crisp-dm: conocimiento del negocio

Video: Meta S. Brown (Keynote): CRISP-DM; The dominant process for data mining

los Cruz-industria de procesos estándar para la Minería de Datos (CRISP-DM) Es el marco de proceso dominante para la minería de datos. En la primera fase de un proyecto de minería de datos, antes de acercarse a los datos o herramientas, a definir lo que está fuera de lograr y definir las razones para querer lograr este objetivo.

La fase de comprensión del negocio incluye cuatro Tareas (Actividades primarias, cada una de las cuales pueden implicar varias partes más pequeñas).

Tarea: La identificación de sus objetivos de negocio

La primera cosa que debe hacer en cualquier proyecto es averiguar exactamente lo que estamos tratando de lograr! Eso es menos obvia de lo que parece. Muchos mineros de datos han invertido tiempo en el análisis de datos, sólo para encontrar que su gestión no estaba particularmente interesado en el tema que estaban investigando. Debe comenzar con una clara comprensión de

  • Un problema que su administración quiere abordar

  • Los objetivos de negocio

  • Restricciones (limitaciones sobre lo que puede hacer, el tipo de soluciones que se pueden utilizar, cuando el trabajo debe ser completado, y así sucesivamente)

  • Impacto (cómo el problema y las posibles soluciones encajan con el negocio)

Entregables para esta tarea incluyen tres artículos (por lo general breves informes centrados únicamente en los puntos principales):

  • Fondo: Explicar la situación de negocios que impulsa el proyecto. Este artículo, al igual que muchos que siguen, asciende sólo a unos pocos párrafos.

  • Objetivos de negocio: Definir lo que su organización tiene la intención de lograr con el proyecto. Esto suele ser un objetivo más amplio de lo que, como un minero de datos, se puede lograr de forma independiente. Por ejemplo, el objetivo de negocio podría ser la de aumentar las ventas de una campaña publicitaria de vacaciones por año de 10 por ciento sobre el año.

  • criterios de éxito de negocio: Definir cómo se medirán los resultados. Trate de obtener criterios de éxito cuantitativos claramente definidos. Si tiene que usar criterios subjetivos (pista: términos como obtener una visión o obtener un identificador de implicar criterios subjetivos), por lo menos llegar a un acuerdo sobre exactamente que ha de juzgar si es o no se han cumplido esos criterios.

Tarea: La evaluación de su situación

Aquí es donde usted entra en más detalles sobre las cuestiones relacionadas con sus objetivos de negocio. Ahora se va a profundizar en la determinación de hechos, la construcción de una explicación mucho más carnoso de las cuestiones que se indican en la tarea objetivos de negocio.

Video: Sistema Datawarehouse en hefesto

Entregables para esta tarea incluyen cinco reportajes en profundidad:

Inventario de recursos: Una lista de todos los recursos disponibles para el proyecto. Estos pueden incluir personas (mineros no sólo datos, sino también los que tienen un conocimiento experto del problema de negocio, administradores de datos, soporte técnico, y otros), datos, hardware y software.

  • Requisitos, supuestos y limitaciones: Requisitos incluirán un calendario de ejecución, de las obligaciones legales y de seguridad, y los requisitos para el trabajo terminado aceptable. Este es el punto para verificar que usted tendrá acceso a los datos apropiados!

  • Riesgos y contingencias: Identificar las causas que podrían retrasar la finalización del proyecto, y preparar un plan de contingencia para cada uno de ellos. Por ejemplo, si una interrupción de Internet en su oficina podría plantear un problema, tal vez su contingencia podría ser trabajar en otra oficina hasta que la interrupción ha terminado.

  • Terminología: Crear una lista de términos de negocio y los términos de minería de datos que son relevantes para su proyecto y se anota en un glosario con las definiciones (y quizás los ejemplos), por lo que todos los involucrados en el proyecto puede tener un entendimiento común de esos términos.

  • Costos y beneficios: Un análisis de coste-beneficio para el proyecto. Trate de indicar todos los costes y beneficios en dólares (euros, libras, yenes, etc.) Los términos. Si los beneficios no superan significativamente los costos, y dejar de considerar este análisis y su proyecto.

  • Los tomadores de decisiones a menudo se sienten más cómodos asignación de recursos a proyectos que reducen los costos que los que tienen por objeto aumentar los ingresos, por lo que siempre busque el potencial de ahorro de costes, y las oportunidades de ahorro de estado por primera vez en su informe de costes y beneficios.

    Video: Proyecto: DATA MINING

    Tarea: La definición de sus objetivos de minería de datos

    Al llegar a la meta de negocio a menudo requiere la acción de muchas personas, no sólo el minero de datos. Así que ahora, debe definir su pequeña parte dentro de la imagen más grande. Si el objetivo de negocio es el de reducir la pérdida de clientes, por ejemplo, sus objetivos de minería de datos podría ser la de identificar las tasas de abandono durante varios segmentos de clientes, y desarrollar modelos para predecir qué clientes tienen mayor riesgo.

    Entregables para esta tarea incluyen dos informes:

    • objetivos de minería de datos: Definir entregables de minería de datos, tales como modelos, informes, presentaciones, y conjuntos de datos procesados.

    • criterios de éxito minería de datos: Definir los criterios técnicos de minería de datos necesarios para apoyar los criterios de éxito de negocio. Tratar de definir estos en términos cuantitativos (tales como la exactitud del modelo o mejora predictivo en comparación con un método existente). Si los criterios deben ser cualitativos, identificar a la persona que hace la evaluación.

    Tarea: Producir el plan del proyecto

    Ahora se especifica en cada paso que usted, el minero de datos, la intención de tomar hasta que el proyecto se ha completado y los resultados se presentan y revisado.

    Video: Big Data Analytics. Minería de Datos para los Negocios. Resumen del curso

    Entregables para esta tarea incluyen dos informes:

    • Plan de proyecto: Esquema de su plan de acción paso a paso para el proyecto. Ampliar el contorno con un calendario para la finalización de cada paso, los recursos requeridos, entradas (tales como datos o una reunión con un experto en la materia) y salidas (tales como los datos limpiados, un modelo o un informe) para cada paso, y dependencias (pasos que no puede comenzar hasta que se haya completado este paso). Explícitamente afirman que ciertos pasos deben repetirse (por ejemplo, el modelado y la evaluación se suelen pedir varias repeticiones atrás y adelante).

    • La evaluación inicial de herramientas y técnicas: Identificar las capacidades requeridas para el cumplimiento de sus objetivos de minería de datos y evaluar las herramientas y los recursos que tiene. Si falta algo, tiene que resolver ese problema muy temprano en el proceso.

    Artículos Relacionados