10 Errores comunes de minería de datos (que no va a hacer)

La minería de datos se realiza por ensayo y error, y por lo tanto, para la minería de datos, cometer errores es muy natural. Los errores pueden ser valiosos, en otras palabras, al menos bajo ciertas condiciones. No todos los errores son iguales, sin embargo. Algunos son simplemente mejor evitar. La siguiente lista ofrece diez de tales errores. Si usted lee a través de ellos con cuidado, y las aprenden de memoria, que sólo podría evitar algunos baches en la curva de aprendizaje:

Saltarse los controles de calidad de datos: La mayoría de los mineros de datos piensan desarrollar modelos de predicción es más divertido que la revisión de los datos para los problemas de calidad. Pero si usted no puede detectar y corregir los problemas de calidad de datos, que podría terminar con las predicciones sin valor.

  • Perdiendo el punto: Usted ha descubierto algo fascinante! Eso está bien, pero si no es también relevante para el problema de negocio que se dispuso a resolver, así, no es relevante en absoluto. Volver a la pista.

  • Estimando que un patrón en los datos demuestra una relación de causa y efecto: A explorar un conjunto de datos y el aviso de que cuando una variable aumenta, se incrementa la variable b, también. Esto podría ocurrir debido a una variable influye en la variable B, o porque las influencias B Variable Variable A. Por otro lado, podría ser que ambos están influenciados por alguna otra variable que no se ha considerado. O podría ser una coincidencia de una sola vez. ¿Quién puede decir?

  • El estiramiento conclusiones demasiado lejos: No suponga que las relaciones que observamos en los datos se repetirán en diferentes circunstancias. Si se recogieron los datos en un ambiente fresco, no asuma que las cosas funcionarán de la misma manera en un ajuste de fábrica caliente.

    Video: Clustering - Tecnicas de Mineria de Datos

  • Las apuestas en resultados que no tienen sentido: métodos de minería de datos son informales y no suele ser respaldado por el método científico y la teoría, por lo que sus resultados tenido mejor al menos sentido comercial. Si no hay ninguna explicación de sentido común para los resultados que presentes, su dirección ejecutiva probablemente no lo tomará en serio, y que no deberían.

    Video: Resumen ejemplo de aplicabilidad minería de datos

  • Enamorarse de un método de modelado en particular: No hay un solo tipo de modelo de minería de datos que se adapte a cada situación.

  • Poner un modelo en producción sin pruebas adecuadas: No apueste su negocio en un modelo predictivo hasta que haya probado con datos de exclusión y en pequeña escala en el campo.

  • Haciendo caso omiso de los resultados que no le gusta: Si ignora ahora sus datos, se va a volver un día y decir: “te lo dije”.

  • El uso de minería de datos para hacer frente a todas las necesidades de análisis de datos: La minería de datos tiene un gran valor, sin embargo, algunas aplicaciones siguen llamando a los métodos rigurosos de recogida de datos, análisis estadístico formal, y el método científico.

  • Suponiendo que las técnicas de análisis de datos tradicionales ya no importa: Consulte el punto anterior.

  • Artículos Relacionados