Conexión de análisis predictivo para disciplinas relacionadas

Video: Economía y su relación con otras disciplinas - Mónica González

El análisis predictivo hace un uso intensivo de tres disciplinas relacionadas: minería de datos, estadísticas y de aprendizaje automático. Las cuatro disciplinas se entrecruzan en gran medida, de tal manera que sus nombres se utilizan indistintamente. Sólo para mantener las cosas en claro, hay algunas diferencias: el análisis predictivo combina muchas de las técnicas, herramientas y algoritmos que la minería de datos, estadísticas, y la máquina de aprendizaje tienen en común.

Su objetivo, sin embargo, es el uso de estas herramientas para comprender los datos, analizarlos, aprender de ella, y crear un modelo matemático que puede hacer predicciones útiles de negocios. Que la orientación futurista es lo que diferencia el análisis predictivo, ya que combina aspectos de las otras tres disciplinas en los distintos pasos o etapas y necesarios para desarrollar un modelo predictivo.

Es la capacidad de predicción que distingue este uso especializado de estadísticas, minería de datos y aprendizaje automático. Vamos a examinar las contribuciones de cada disciplina.

Video: DISCIPLINAS Y METODOS FILOSOFICOS by videoshow

Estadística

Las estadísticas son números que resultan de la medición de los datos empíricos con el tiempo. Como disciplina, la estadística se ocupa de la recogida y análisis de datos - a menudo para contar una historia en números.

Las estadísticas pueden inferir las relaciones dentro de Datos- por lo tanto, desempeña un papel activo en la presentación de los datos y contribuir a su comprensión. Usando sólo una muestra de los datos, las estadísticas le puede dar una base para inferir hipótesis acerca de los datos en su conjunto. Así, la disciplina es a la vez descriptivo y inferencial.

Estadística inferencial se ocupa de hacer inferencias o predicciones sobre las características de toda una población de un conjunto de datos de muestra. datos de muestra para el análisis se elige al azar, de una manera que representa (pero no incluye) toda la población, lo que es difícil tener acceso a. Cuando la muestra de datos está bien elegido, el análisis que permite al investigador para proyectar los resultados del análisis sobre la totalidad de la población con un grado apreciable de precisión.

Estadísticas depende, por supuesto, en las matemáticas para analizar los datos mediante la verificación de una hipótesis o teoría, determinar su exactitud, y llegar a una conclusión.

Es el trabajo de los estadísticos para probar o refutar, con una sola muestra, si su hipótesis sobre la población es cierto. El hecho de que una hipótesis precede el análisis es una distinción clara para las estadísticas, y una característica que lo diferencia de otras técnicas.

A diferencia de la minería de datos, las estadísticas no implica la limpieza de datos o procesamiento previo. Pero la estadística descriptiva y la minería de datos tienen datos de agrupación en común- ambas apuntan a describir los datos y definir los procesos utilizados para clasificarla.

Un denominador común entre todas estas disciplinas es la matemática subyacente. La matemática es la base de las estadísticas, y todos los algoritmos y de programación utilizado en la minería de datos, aprendizaje automático, y el análisis predictivo. Otro denominador común es el análisis de datos, la búsqueda de la mejor informadas, decisiones inteligentes sobre los resultados futuros.

La minería de datos

La minería de datos se ocupa principalmente de análisis de datos a través de describir, resumir, clasificar y agrupar los datos con el fin de encontrar patrones útiles, vínculos o asociaciones dentro de ella.

La minería de datos se utiliza a menudo de forma intercambiable con el aprendizaje de máquina, pero hay algunas diferencias entre los dos términos. Por ejemplo: la minería de datos están familiarizados con el uso de la máquina de aprendizaje para realizar algunas tareas que involucran grandes cantidades de datos. Sin embargo, también pueden crear una consulta sofisticado y optimizado en una base de datos sin el uso de la máquina de aprendizaje - que todavía se considera la minería de datos. Esto es similar al descubrimiento de conocimiento en bases de datos, (KDD). Se encuentra en el conocimiento de datos y hace hincapié en una amplia aplicación de determinadas técnicas de minería de datos.

Aprendizaje automático

Aprendizaje automático es otra disciplina que se centra en el análisis de los datos y hacer sentido de ella - pero lo hace mediante la enseñanza de un programa de ordenador para hacer el trabajo. Cuanto más datos se analizan, más el sistema puede aprender acerca de él, lo que puede esperar de ella, y qué hacer con él. El análisis de datos se convierte en una fuente de retroalimentación continua para el sistema, que analiza los datos rápidamente, trata de entender y dar sentido a ella, y se pone mejor en esas tareas.

Video: Ética y relación con otras disciplinas

Cuando un nuevo caso especial, por lo general una excepción o un nuevo comportamiento, se procesa por primera vez, la base de conocimiento del sistema se incrementa para incluir el nuevo caso. Los casos más especiales se manejan, el mejor equipado del sistema es tomar decisiones que producen el resultado más útil. Esta es la naturaleza del aprendizaje que la máquina está programado para hacer.

El aprendizaje automático es el equivalente a la enseñanza de un sistema de las reglas de un juego, y luego conseguir que el sistema practicar el juego al jugar en los niveles elemental e intermedio. Después de que la preparación, el sistema puede reproducir en niveles avanzados en tiempo real.

IBM Watson utiliza el procesamiento del lenguaje natural y de aprendizaje automático para revelar puntos de vista de grandes cantidades de datos no estructurados. Watson se utilizó en un 2011 Peligro! coincide, y ganó. Antes de eso, Deep Blue de IBM venció campeón mundial Gary Kasparov en ajedrez. En 2016, AlphaGo de Google venció a la campeona del mundo, Lee Sedol, en Go (un juego mucho más difícil de conquistar, porque Go es exponencialmente más complejo que el ajedrez).

El aprendizaje automático es ideal para

datos complejos
Los datos en diversas formas
Los datos recogidos de diversas fuentes
Los datos en grandes cantidades

La minería de datos puede revelar conexiones previamente desconocidas y asociaciones en los datos. El aprendizaje automático puede categorizar los nuevos y futuros incógnitas, aprender de ellos en función de su procesamiento previo de los datos, y mejorar en su incorporación en los datos conocidos. Ambas técnicas conducen a un mayor conocimiento y comprensión de los datos.