¿Qué datos mineros

Si se piensa en los datos como materia prima, y ​​la información se puede obtener a partir de datos como algo valioso y relativamente refinada, el proceso de extracción de información puede ser comparada a la extracción de metales a partir de minerales o gemas de la suciedad. Así es como el término minería de datos originada.

Centrándose en el negocio de la minería de datos

Los analistas de datos no sólo se ponderan los datos sin rumbo, con la esperanza de encontrar algo interesante. Cada proyecto de minería de datos comienza con un problema de negocio específico y un gol de igualar.

Como un minero de datos, es probable que no tienen la autoridad para tomar decisiones de negocio finales, por lo que es importante que alinear su trabajo con las necesidades de los tomadores de decisiones. Usted debe entender sus problemas, necesidades y preferencias, y centrar sus esfuerzos en el suministro de información que apoya las buenas decisiones de negocio.

Su propio conocimiento del negocio es muy importante. Los ejecutivos no van a sentarse al lado de usted mientras usted trabaja, proporcionando información sobre la relevancia de sus descubrimientos a sus preocupaciones. Debe utilizar su propia experiencia y la perspicacia para juzgar por sí mismo que a medida que trabaja.

La comprensión de cómo la minería de datos pasan su tiempo

Sería muy bueno si la minería de datos podrían pasar todo el día haciendo descubrimientos que cambian la vida, la construcción de modelos valiosos, y su integración en los negocios cotidianos. Pero eso es como decir que sería genial si los atletas podrían pasar todo el día ganando torneos. Se necesita mucha preparación para construir hasta esos momentos de triunfo. Por lo tanto, al igual que los atletas, la minería de datos pasan mucho tiempo en la preparación.

Video: 5 años después: cifras y datos que quizá no conocía de la tragedia de los 33 mineros de Chile

Conocer el proceso de minería de datos

Un buen proceso de trabajo le ayuda a sacar el máximo provecho de su tiempo, sus datos, y todos los demás recursos. En este libro, descubrirá los más populares proceso de minería de datos, CRISP-DM. Es un ciclo de seis fases de descubrimiento y acción creado por un consorcio de minería de datos de muchas industrias, y un estándar abierto que cualquiera puede usar.

Las fases del proceso de CRISP-DM son

  1. Comprensión del negocio

  2. La comprensión de datos

  3. Preparación de datos

  4. Modelado

  5. Evaluación

  6. De despliegue (utilizando modelos de negocio todos los días)

Cada fase tiene el mismo peso en importancia a la calidad de los resultados y el valor para el negocio. Pero en términos del tiempo requerido, la preparación de datos domina. Preparación de datos rutinariamente lleva más tiempo que el resto de las fases del proceso de minería de datos combinado.

Haciendo modelos

Cuando los objetivos se entienden, y los datos se limpia y listo para usar, se puede dar vuelta a su atención a la construcción de modelos predictivos. Modelos hacen lo informa cannot- te dan información que apoya la acción.

Un informe puede dirá que las ventas han bajado. Se puede romper las ventas por región, producto y canal para que sepa donde se redujeron las ventas y si estos descensos fueron generalizados o afectó sólo a ciertas áreas. Pero ellos no le dan ninguna pista sobre por qué las ventas disminuyeron o qué acciones podrían ayudar a revivir el negocio.

Los modelos ayudan a entender los factores que las ventas de impacto, las acciones que tienden a aumentar o disminuir las ventas, y las estrategias y tácticas que mantienen su negocio funcionando sin problemas. Eso es emocionante, ¿verdad? Tal vez por eso la mayoría de los mineros de datos de modelado consideran que es la parte divertida del trabajo.

La comprensión de los modelos matemáticos

Los modelos matemáticos son fundamentales para la minería de datos, pero ¿qué son? ¿Qué hacen, cómo funcionan, y cómo se se crean?

Un modelo matemático es, así de simple, una ecuación, o conjunto de ecuaciones, que describen una relación entre dos o más cosas. Tales ecuaciones son la abreviatura de teorías sobre los mecanismos de la naturaleza y la sociedad. La teoría puede ser apoyado por un cuerpo considerable de pruebas o puede ser simplemente una conjetura salvaje. El lenguaje de las matemáticas es el mismo en ambos casos.

Términos tales como modelo predictivo, el modelo estadístico, o modelo lineal referirse a tipos específicos de modelos matemáticos, los nombres reflejan el uso previsto, la forma, o el método de derivar un modelo particular. Estos tres ejemplos son sólo algunos de muchos de estos términos.

Cuando un modelo se menciona en un entorno de negocios, lo más probable es un modelo utilizado para hacer predicciones. Los modelos se utilizan para predecir los precios de acciones, venta de productos, y las tasas de desempleo, entre muchas otras cosas.

Estas predicciones pueden o no ser exacta, sino para cualquier conjunto dado de valores (factores conocidos como estos se denominan variables independientes o entradas) Incluidos en el modelo, se encuentra una predicción bien definido (también llamado variable dependiente, de salida, o resultado). Los modelos matemáticos se utilizan para otros fines en los negocios, así como para describir los mecanismos de trabajo que impulsan un proceso en particular.

Video: Que Es Mineria Bitcoin Y Para Que Sirve

En la minería de datos, puede crear modelos mediante la búsqueda de patrones en los datos utilizando la máquina de aprendizaje o métodos estadísticos. Los analistas de datos no siguen el mismo enfoque riguroso que los estadísticos clásicos hacen, pero todos los modelos se derivan de los datos reales y técnicas de modelado matemático consistentes. Todos los modelos de minería de datos se apoyan en un conjunto de pruebas.

¿Por qué utilizar modelos matemáticos? no podían ser las mismas relaciones describen el uso de palabras? Es posible, sin embargo, se encuentran ciertas ventajas en el uso de ecuaciones. Éstas incluyen

  • Conveniencia: En comparación con las descripciones equivalentes escritos en frases, las ecuaciones son breves. simbolismo matemático se ha desarrollado específicamente para el propósito de representar idiomas relaciones-matemáticos tales como Inglés no haber.

  • Claridad: Ecuaciones transmitir ideas de manera sucinta y no son ambiguas. No están sujetos a diferentes interpretaciones basadas en la cultura, y el simbolismo de las matemáticas es una especie de lenguaje común que se utiliza ampliamente en todo el mundo.

  • Consistencia: Debido a que las representaciones matemáticas no son ambiguas, las implicaciones de cualquier situación particular están claramente definidos por un modelo matemático.

Poner la información en acción

Un modelo sólo proporciona un valor cuando lo utiliza en el negocio. Las predicciones de un modelo puedan apoyar la toma de decisiones en una variedad de maneras. Tú podrías

  • Incorporar las predicciones en un informe o presentación para ser utilizados en la fabricación de una decisión específica.

  • Integrar el modelo en un sistema operativo (por ejemplo, un sistema de servicio al cliente) para proporcionar predicciones en tiempo real para el uso diario. (Por ejemplo, es posible que las reclamaciones de seguros para el pago inmediato de la bandera, la negación inmediata, o una mayor investigación.)

  • Utilizar el modelo para la predicción por lotes. (Por ejemplo, se puede anotar la lista de clientes de la casa para decidir qué clientes deben recibir una oferta particular).

Artículos Relacionados