La elección de un algoritmo para el análisis predictivo

Varios datos, la minería, y de aprendizaje automático algoritmos estadísticos están disponibles para su uso en el modelo de análisis predictivo. Usted está en una mejor posición para seleccionar un algoritmo después de que haya definido los objetivos de su modelo y ha seleccionado los datos que vamos a trabajar en. Algunos de estos algoritmos se han desarrollado para resolver problemas específicos del negocio, mejorar los algoritmos existentes, o proporcionar nuevas capacidades - que puede hacer que algunos de ellos más apropiado para sus propósitos que otros. Puede elegir entre una variedad de algoritmos para abordar las preocupaciones de negocios, tales como las siguientes:

  • Para la segmentación de clientes y / o detección de la comunidad en el ámbito social, por ejemplo, que había necesidad de algoritmos de agrupamiento.
  • Para la retención de clientes o para desarrollar un sistema de recomendación, que tendría que utilizar algoritmos de clasificación.
  • Para la puntuación de crédito o predecir el siguiente resultado de los eventos controlados por tiempo, tendrá que utilizar un algoritmo de regresión.

A medida que permitan el tiempo y los recursos, se debe ejecutar el mayor número de algoritmos del tipo apropiado como sea posible. La comparación de diferentes carreras de diferentes algoritmos puede traer sorprendentes hallazgos acerca de los datos o de la inteligencia de negocio incrustado en los datos. Si lo hace, le da una visión más detallada en el problema de negocio, y le ayuda a identificar qué variables dentro de sus datos tiene poder predictivo.

Algunos proyectos de análisis predictivo de éxito mediante la construcción de un mejor modelo de conjunto, un grupo de modelos que operan en los mismos datos. Un modelo conjunto predefinido utiliza un mecanismo para recopilar los resultados de todos sus modelos de componentes y proporcionar un resultado final para el usuario.

Los modelos pueden adoptar diversas formas - una consulta, una colección de escenarios, un árbol de decisión, o un análisis matemático avanzado. Además, algunos modelos funcionan mejor para ciertos datos y análisis. Se puede (por ejemplo) utiliza algoritmos de clasificación que emplean reglas de decisión para decidir el resultado de un escenario o una transacción dada, dirigiéndose a preguntas como las siguientes:

  • Es probable que respondan a nuestra campaña de marketing a este cliente?
  • Es probable que sea parte de un esquema de lavado de dinero esta transferencia de dinero?
  • Es probable que por defecto en el préstamo de este solicitante del préstamo?

Se puede utilizar algoritmos de agrupamiento no supervisado para encontrar qué relaciones existen dentro de su conjunto de datos. Puede utilizar estos algoritmos para encontrar diferentes agrupaciones entre sus clientes, determinar qué servicios se pueden agrupar juntos, o decidir, por ejemplo, qué productos pueden ser venta sugestiva.

algoritmos de regresión se pueden utilizar para pronosticar los datos continuos, tales como la predicción de la tendencia de una población dada movimiento de sus precios anteriores.

Los árboles de decisión, máquinas de vectores de soporte, redes neuronales, logística y regresiones lineales son algunos de los algoritmos más comunes. Aunque sus implementaciones matemáticos difieren, estos modelos predictivos generan resultados comparables. Los árboles de decisión son más populares, porque son fáciles de entender: usted puede seguir el camino a una decisión determinada.

algoritmos de clasificación son grandes para el tipo de análisis cuando se conoce la diana (tales como identificar correos electrónicos no deseados). Por otro lado, cuando la variable de destino es desconocido, algoritmos de agrupamiento son la mejor opción. Ellos le permiten racimo o grupo de sus datos en grupos significativos en base a las similitudes entre los miembros del grupo.

Estos algoritmos son muy populares. Hay muchas herramientas, tanto de código abierto y comercial, que ponen en práctica. Con la acumulación de datos próspera y la aceleración (es decir, grandes volúmenes de datos), y hardware y plataformas (tales como la computación en nube y Hadoop) rentable, herramientas de análisis predictivo están experimentando un auge.

objetivos de datos y comerciales que no son los únicos factores a considerar cuando se está seleccionando un algoritmo. La experiencia de los científicos de datos es de gran valor en este punto- recoger un algoritmo que va a hacer el trabajo es a menudo una combinación complicada de la ciencia y el arte. La parte del arte proviene de la experiencia y habilidad en el dominio del negocio, que también juega un papel crítico en la identificación de un modelo que puede servir a los objetivos de negocio con exactitud.

Artículos Relacionados