9 La ley de minería de datos

Cada profesión tiene sus principios rectores, las ideas que proporcionan estructura y orientación en el trabajo diario. La minería de datos no es una excepción. A continuación se presentan nueve ideas fundamentales que le guiará a medida que se reduce a trabajar y convertirse en un minero de datos. Estas son las 9 leyes de minería de datos, ya que fueron expresados ​​originalmente por el minero de datos pionero, Thomas Khabaza.

Primera ley: Los objetivos de negocio

Aquí está la primera ley de minería de datos, o “Ley de objetivos de negocio”: Los objetivos de negocio son el origen de todas las soluciones de minería de datos.

Que explora los datos para encontrar la información que le ayuda a manejar el negocio mejor. ¿No debería ser el mantra de todos los análisis de datos de la empresa? Por supuesto que debe! Sin embargo, la minería de datos novatos a menudo se centran en la tecnología y otros detalles, que pueden ser interesantes, pero no alineados con las necesidades y objetivos de ejecutivos que toman las decisiones.

Hay que desarrollar un hábito de identificar los objetivos de negocio antes de hacer cualquier otra cosa, y se centra en los objetivos a cada paso en el proceso de minería de datos. Es significativo que esta ley es lo primero. Todo el mundo debe entender que la minería de datos es un proceso con un propósito.

Segunda ley: Conocimiento del negocio

Aquí está la segunda ley de minería de datos, o “Ley de negocios Conocimiento”: conocimiento del negocio es fundamental para cada paso del proceso de minería de datos.

La minería de datos da potencia a las personas - empresarios - que utilizan su conocimiento del negocio, experiencia y conocimiento, junto con los métodos de minería de datos, encontrar sentido a los datos.

Usted no tiene que ser un estadístico sofisticado para la minería de datos, pero usted tiene que saber algo sobre lo que el significa de datos y cómo funciona el negocio. Sólo cuando se comprende los datos y el problema que tiene que resolver los procesos de minería de datos puede ayudar a descubrir información útil y ponerla en uso.

3ª ley: Preparación de datos

Aquí está la tercera ley de minería de datos, o “Ley de Preparación de Datos”: preparación de datos es más de la mitad de todos los procesos de minería de datos.

los estadísticos tradicionales a menudo tienen la oportunidad de recoger nuevos datos para hacer frente a cuestiones de investigación específicas. Pueden utilizar procesos rigurosos para planificar experimentos, cuestionarios de la encuesta de investigación de diseño o de otra manera recopilar datos de alta calidad que está bien orientados a objetivos específicos de investigación. Sin embargo, después de todo eso, todavía pasan mucho tiempo de limpieza y preparación de datos para su análisis.

Los analistas de datos, por el contrario, casi siempre tienen que trabajar con lo que se dispone de datos. Utilizan los registros existentes de negocio, datos públicos, o los datos que pueden comprar. Es probable que, todos esos datos se obtuvo por algún otro propósito que la minería de datos, y sin ningún riguroso plan o proceso de recopilación de datos cuidado. Así que la minería de datos pasan mucho tiempo en la preparación de los datos.

Cuarta ley: Modelo de Derecho

Aquí está la cuarta ley de minería de datos, o “NFL-DM”: El modelo adecuado para una aplicación determinada sólo puede ser descubierto por el experimento.

Esta ley también es conocido por la abreviatura de la NFL-DM, lo que significa que no hay almuerzo gratis para la minería de datos.

En primer lugar, ¿qué es un modelo? Es una ecuación que representa un patrón observado en los datos. Por lo menos, que representa el patrón de una manera aproximada. Los modelos matemáticos de las cosas reales no son perfectas! Este es un hecho de la vida, y es tan cierto para los físicos nucleares como lo es para la minería de datos.

En la minería de datos, los modelos se seleccionan a través de ensayo y error. Va a experimentar con diferentes tipos de modelos.

5º ley: Patrón

Aquí está la quinta Ley de Minería de datos: Siempre hay patrones.

Como un minero de datos, explorará los datos en busca de patrones útiles. En otras palabras, se le busca por relaciones significativas entre las variables en los datos. La comprensión de estas relaciones proporciona una mejor comprensión del negocio, y mejores predicciones de lo que ocurrirá en el futuro. Lo más importante es la comprensión de los patrones en los datos que permite influir en lo que sucederá en el futuro.

Siempre encuentras patrones. Los datos siempre tiene algo que decirte. A veces, se confirma que lo que has estado haciendo es correcto. Esto puede no parecer emocionante, pero al menos te dice que has estado en el camino correcto. Otros días, los datos pueden decir que sus prácticas comerciales actuales no funcionan. Eso es emocionante, y aunque puede que no sea agradable en el corto plazo, sabiendo la verdad es un paso importante hacia la mejora.

6 de la ley: La amplificación

Aquí está la sexta ley de minería de datos, o “Ley Insight”: La minería de datos amplifica la percepción en el ámbito empresarial.

métodos de minería de datos permiten entender mejor su negocio lo que podría haber hecho sin ellos. métodos de minería de datos ayudan te gusta una lupa o un microscopio, lo que permite el descubrimiento de los efectos que serían difíciles o imposibles de detectar a través de informes ordinaria.

La minería de datos no es instantánea.

Descubrimiento y aprendizaje a través de la minería de datos es un proceso interactivo. Usted va a hacer descubrimientos, encontrar un poco de cada uno de ellos, y utilizar lo que has descubierto que tomar medidas. Los resultados de cada acción que intenta producirán más datos, y que los datos le permite entender algo más. Es un ciclo de descubrimiento, y el ciclo continúa mientras usted continúa para explorar y experimentar.

7 de la ley: Predicción

Aquí está el séptimo Ley de minería de datos, o “Ley de Predicción”: Predicción aumenta la información a nivel local por la generalización.

La minería de datos ayuda a usar lo que sabe hacer mejores predicciones (o estimaciones) de las cosas que no conoces. La minería de datos utiliza métodos de modelado de datos y reemplazar sus expectativas informales con estimaciones basadas en datos, consistente y más precisos.

8 de la ley: Valor

Aquí está la octava Ley de minería de datos, o “Ley de Valor”: El valor de los resultados de minería de datos no está determinada por la precisión o la estabilidad de los modelos predictivos.

Los analistas de datos No se complique sobre la teoría. Como un minero de datos, es posible que ni siquiera conocer la teoría detrás de los modelos estadísticos que utiliza. Tal vez es mejor así, porque en la minería de datos, usted va a utilizar esos modelos en formas que no necesariamente se alinean con la teoría detrás de ellos.

Te vas a ver los modelos que producen predicciones correctas (y que va a utilizar la prueba, en lugar de la teoría estadística, a juzgar eso). Pero puede estar más preocupados por otras cuestiones, como si el modelo tiene sentido comercial, que ilumina acerca de los factores predictivos inesperados o es práctico para utilizar en su lugar de trabajo.

9 de la Ley: Cambio

Aquí está la novena ley de minería de datos, o “ley del cambio”: Todos los modelos están sujetos a cambios.

El mundo siempre está cambiando. El modelo que le da grandes predicciones hoy puede ser inútil mañana. Este es un hecho de la vida de todos los analistas de datos, no sólo a la minería de datos.

Artículos Relacionados