La comprensión de la clasificación de datos y su papel en el análisis predictivo

Video: Análisis Predictivo en la gestión RR.HH

La minería de datos es una parte necesaria del análisis predictivo. En la minería de datos, clasificación de datos es el proceso de etiquetado de un elemento de datos como pertenecientes a una clase o categoría. Un elemento de datos también se conoce (en el vocabulario de minería de datos) como objeto de datos, la observación, o ejemplo.

la agrupación de datos es diferente de la clasificación de los datos:

  • agrupamiento de datos se usa para describir los datos mediante la extracción de grupos significativos o categorías de un cuerpo de datos que contiene elementos similares.
  • La clasificación de datos se utiliza para predecir la categoría o la agrupación de que un nuevo y entrante objeto de datos pertenece.

Se puede utilizar la clasificación de datos para predecir nuevos elementos de datos en la base de las agrupaciones descubiertos por un proceso de agrupamiento de datos. Sigue leyendo para averiguar cómo utilizar la clasificación de datos para resolver un problema práctico.

Préstamo

Un préstamo puede servir como un ejemplo cotidiano de clasificación de datos. El oficial de préstamo tiene que analizar las solicitudes de crédito para decidir si el solicitante se le concede o se niega un préstamo.

Una manera de tomar una decisión tan crítico es el uso de un clasificador para ayudar en el proceso de toma de decisiones. En esencia, el clasificador es simplemente un algoritmo que contiene instrucciones que le indican a la computadora cómo analizar la información mencionada en la solicitud de préstamo, y cómo hacer referencia a otras fuentes (externas) de información sobre el solicitante. Entonces el clasificador puede etiquetar la solicitud de préstamo como accesorio una de estas categorías de muestra, tales como “seguro”, “demasiado arriesgado”, o “seguro con las condiciones de” suponiendo que estas categorías exactas son conocidos y se marcaron en los datos históricos.

Mediante la eliminación de la mayor parte del proceso de toma de las manos del analista de crédito o asegurador, el modelo reduce el esfuerzo de trabajo humano y el riesgo de la cartera de la compañía. Esto aumenta la rentabilidad de la inversión (ROI) permitiendo que los empleados se originan más préstamos y / o conseguir un mejor precio si la compañía decide revender el préstamo de mayor calidad.

Si el clasificador regresa con un resultado que etiqueta a un solicitante como “segura con condiciones”, entonces el procesador de préstamos o funcionario puede solicitar que el solicitante cumple las condiciones con el fin de obtener el préstamo. Si se cumplen las condiciones, entonces los nuevos datos se pueden ejecutar a través del clasificador de nuevo para su aprobación. El uso de la máquina de aprendizaje, el clasificador solicitud de préstamo será aprender de las aplicaciones anteriores, aprovechar la información actual mencionados en la demanda, y predecir el comportamiento futuro del solicitante del préstamo.

Como siempre, la predicción del futuro se trata de aprender del pasado y evaluar el presente. La clasificación de datos se basa tanto en la información pasada y actual - y acelera la toma de decisiones mediante el uso de tanto más rápido.

Márketing

Para ilustrar el uso de los clasificadores en la comercialización, considere un vendedor que ha sido asignado para diseñar una estrategia de marketing inteligente para un producto específico. La comprensión de la demografía de los clientes impulsa el diseño de una estrategia de marketing eficaz. En última instancia, ayuda a la empresa seleccionar los productos adecuados para anunciar a los clientes más propensos a comprar.

Por ejemplo, uno de los criterios que se pueden utilizar para seleccionar los clientes que se orienta la ubicación geográfica específica. Es posible que tenga una tienda desconocida (o una tienda que no es conocido por la venta de un producto en particular - por ejemplo, una tienda de artículos para el hogar que podrían comenzar a vender un nuevo procesador de alimentos) y que desea iniciar una campaña de marketing para la nueva línea de productos.

Utilizando los datos que ha recopilado o compró a una agencia de marketing, usted puede construir su clasificador. Usted puede diseñar un clasificador que anticipa si los clientes van a comprar el nuevo producto. Para cada perfil de cliente, el clasificador predice una categoría que se adapte a cada línea de producto se ejecuta a través de él, el etiquetado del cliente como (por ejemplo) “interesado”, “no le interesa”, o “desconocido”.

Utilizando el análisis producido por el clasificador, se puede identificar fácilmente las ubicaciones geográficas que tienen el mayor número de clientes que se adapten a la categoría de “interesados”. Su modelo descubre, por ejemplo, que la población de San Francisco incluye un gran número de clientes que han comprado un producto similar a lo que tiene a la venta.

Saltar en esta oportunidad para actuar en el conocimiento de su modelo acaba de presentar a usted. Usted puede enviar un anuncio de ese nuevo gadget interesante para aquellos clientes - y sólo a ellos.

Video: Introducción al Análisis de Datos (2/5)

Para limitar los costos de operación y comercialización, se debe evitar el contacto con clientes-desinteresado esfuerzo desperdiciado afectaría su ROI. Por lo demás, tener demasiado contacto innecesario con los clientes puede diluir el valor de sus campañas de marketing y aumentar la fatiga del cliente hasta que sus solicitudes parecen más como una molestia. Usted no quiere que sus volantes brillantes para aterrizar inmediatamente en el cubo de la basura o de sus e-mails a terminar en la carpeta de correo no deseado.

Como vendedor, es posible que desee utilizar los datos sobre los perfiles de los clientes potenciales que han sido recogidos de diferentes fuentes o suministrado por un tercero. Estas fuentes incluyen las redes sociales y bases de datos de las transacciones en línea históricos por los clientes.

Cuidado de la salud

En el campo médico, un clasificador puede ayudar a un médico se asientan en el tratamiento más adecuado para un paciente dado. Puede ser diseñado para analizar los datos de los pacientes, aprender de ella, y clasificar al paciente como pertenecientes a una categoría de pacientes similares. El clasificador puede aprobar recomendar el mismo tratamiento que ayudó a pacientes similares de la misma categoría en el pasado.

Al igual que en los ejemplos descritos anteriormente, el clasificador predice una etiqueta de categoría o clase para la entrada, utilizando los datos pasados ​​y actuales. En el caso de la asistencia sanitaria, el modelo predictivo puede utilizar más datos, más rápidamente, para ayudar al médico a llegar a un tratamiento efectivo.

Para ayudar a los médicos prescribir la medicina individualizada, el clasificador les ayudaría a determinar la etapa específica de la enfermedad de un paciente. Hipotéticamente, los datos (digamos, el análisis genético de una muestra de sangre) podrían ser alimentados a un clasificador entrenado que podría etiquetar la etapa de la enfermedad de un paciente nuevo. En el caso de cáncer (por ejemplo), el clasificador podría tener tales etiquetas - que describen las siguientes clases o agrupaciones - como “sano”, “benigna”, “estadio temprano”, “metastásico” o “terminal”.

¿Que sigue?

los usos futuros de clasificadores prometen ser aún más ambicioso. Suponga que desea predecir la cantidad de un cliente va a gastar en una fecha específica. En tal caso, se diseña un clasificador que predice valores numéricos en lugar de nombres de las categorías especificadas. Por supuesto, los predictores numéricos se pueden desarrollar utilizando no sólo métodos estadísticos como la regresión, sino también a otras técnicas de extracción de datos, tales como redes neuronales. Dadas diseños suficientemente sofisticados, los clasificadores se utilizan comúnmente en campos tales como las elecciones presidenciales, la seguridad nacional, y el cambio climático.

Artículos Relacionados