La minería de datos

La característica distintiva sobre la minería de datos, en comparación con las consultas, informes, o incluso OLAP, es que se puede obtener información sin tener que hacer preguntas específicas.

La minería de datos sirve para dos funciones principales en su misión de inteligencia de negocio:

  • El “Dime lo que podría suceder” papel: El primer papel de la minería de datos es predictivo, en el que básicamente dice: “Dime lo que podría suceder.” Utilizando el conocimiento oculto encerrado en su almacén de datos, probabilidades y la probabilidad de las tendencias y acontecimientos futuros están husmeado y presentado a usted.

  • El “Dime algo interesante” papel: Además de los posibles eventos y sucesos futuros, la minería de datos también se trata de sacar información interesante que probablemente debería conocer, tales como una relación particularmente inusual entre las ventas de dos productos diferentes y la forma en que la relación varía de acuerdo a la colocación en sus tiendas al por menor.

    Aunque muchos de estos datos interesantes es probable que existan, lo que preguntas le haría si estuviera usando una consulta o una herramienta OLAP, y ¿cómo interpretar los resultados? La minería de datos que asiste en esta ardua tarea de averiguar qué preguntas hacer haciendo gran parte del trabajo por ti.

Video: Clase No .1 Minería de Datos

La minería de datos en las misiones específicas de negocio

La minería de datos es particularmente adecuado para estos tipos específicos de misiones de negocios:

  • fraude detectar

  • La determinación de la efectividad del programa de marketing

  • Selección de los cuales, a partir de una gran base de clientes o la población en general, se debe orientar como parte de un programa de marketing

  • La gestión del ciclo de vida del cliente, incluyendo la misión de retención de clientes

  • Realización de avanzada de modelado de procesos de negocio y escenarios hipotéticos

Pensar en lo que hay detrás de cada una de las misiones de negocios en la lista anterior:

  • Una gran cantidad de datos

  • Un número aún mayor de combinaciones de varias piezas de datos

  • análisis de los resultados conjunto intensivo, implicando generalmente complejos algoritmos y técnicas estadísticas avanzadas

Ahora, piensa en lo que tendría que hacer si estuviera usando una herramienta de informes OLAP o para llevar a cabo estas misiones. Se podría encontrar que es prácticamente imposible realizar a fondo cualquiera de las misiones anteriores si tuviera que hacer una pregunta y obtener un resultado, hacer otra pregunta y obtener otro resultado, y luego seguir repitiendo estos pasos.

La minería de datos y la inteligencia artificial

Si usted ha estado en el campo de la tecnología de la información (TI) durante al menos una década, algunos de los términos anteriores puede sonar vagamente familiar. Desbloqueo de conocimiento oculto? funcionalidad de predicción? Espera un minuto - que es la inteligencia artificial!

Desde los primeros días de la computación comercial, ha habido un gran interés en el desarrollo de “máquinas pensantes” que pueden procesar grandes cantidades de datos y tomar decisiones sobre la base de ese análisis.

El interés en la inteligencia artificial (IA) alcanzó su cenit a mediados de la década de 1980. En ese momento, los proveedores de bases de datos trabajaron en la producción de sistemas de gestión de base de conocimientos (KBMSs) - otros vendedores salieron con shells de sistemas expertos, o marcos de desarrollo de aplicaciones basadas en IA que utilizan técnicas tales como el encadenamiento hacia adelante y hacia atrás en cadena para asesorar a los usuarios acerca de las redes neuronales decisiones- y se posiciona como el próximo gran desarrollo de la IA.

El interés por AI disminuyó a principios de 1990, cuando las expectativas exceden las capacidades disponibles y otros delirios, como la migración de cliente / servidor y almacenamiento de datos (por supuesto), tomaron el centro del escenario.

Ahora, la IA está de vuelta!

Video: ¿Qué es la Mineria de Datos?

La técnica de IA de más alto perfil utilizado en la minería de datos es redes neuronales. redes neuronales se concibieron originalmente como un modelo de procesamiento que imitar la forma del cerebro humano resuelve problemas, usando neuronas y procesamiento altamente paralelo para hacer la solución patrón.

La aplicación de algoritmos de redes neuronales para las áreas de inteligencia de negocio que las manijas de minería de datos (de nuevo, predictivo y “Dime algo interesante” misiones) parece ser una coincidencia natural.

Video: Minería de Datos

Aunque el / juego de red neuronal minería de datos es, sin duda vale la pena mirar en, usted debe hacer con cuidado. Se puede encontrar una gran cantidad de tecnologías interesantes y emocionantes que, en manos de aquellos que no entienden los algoritmos, probablemente fallará.

Sin embargo, con el conocimiento y la educación adecuada, se puede hacer un compromiso a gran escala para llevar este tipo de transformación en el marco de la inteligencia de negocio como el emparejamiento-análisis técnico para el análisis de negocio centrada OLAP.

La minería de datos y estadísticas

El área más madura de la minería de datos es la aplicación de técnicas estadísticas avanzadas contra los grandes volúmenes de datos en el almacén de datos. Diferentes herramientas utilizan diferentes tipos de técnicas estadísticas, adaptados a las áreas particulares que están tratando de resolver.

Video: Curso BD || Sesion 11.1 || Minería de Datos

Sin una base estadística, es posible encontrar gran parte de la minería de datos confusos. Que tiene que hacer mucho trabajo para entrenar los algoritmos y construir las reglas para asegurar resultados adecuados con grandes conjuntos de datos. Sin embargo, en el supuesto de que se siente cómodo con este concepto, o tener un colega que puede ayudar, aquí están algunos de los algoritmos más ampliamente apalancada:

  • algoritmos de clasificación: Predecir una o más variables discretas, basadas en los demás atributos del conjunto de datos. Mediante el uso de algoritmos de clasificación, la herramienta de minería de datos puede mirar a grandes cantidades de datos y luego informarle de que, por ejemplo, “Los clientes que se conservan a través de al menos dos generaciones de las compras de productos tienden a tener estas características: Tienen un ingreso de por lo por lo menos $ 75.000, y ellos son dueños de sus propios hogares “.

  • algoritmos de regresión: Predecir una o más variables continuas, tales como cambios en resultados, basados ​​en otros atributos del conjunto de datos. algoritmos de regresión son conducidos a través de la información histórica presentada a la herramienta de minería de datos “con el tiempo”, mejor conocido como series de tiempo información.

  • algoritmos de segmentación: Dividir los datos en grupos, o racimos, de los artículos que tienen propiedades similares.

  • algoritmos de asociación: Encontrar correlaciones entre los diferentes atributos en un conjunto de datos. La aplicación más común de este tipo de algoritmo crea reglas de asociación, que se pueden utilizar en un análisis de la cesta. Tenga en cuenta que, por ejemplo, si un cliente compra un paquete de software en particular, él o ella tiene una oportunidad de 65 por ciento de la compra de al menos dos productos específicos paquetes adicionales dentro de dos semanas.

  • algoritmos de análisis de secuencia: Resumir secuencias frecuentes o episodios en los datos, tales como un flujo de web-path.

Existen muchos más métodos. El polvo de ese libro estadísticas viejos y empezar a leer.

Artículos Relacionados