¿Qué es la ciencia de datos centrada en el negocio?

Dentro de la empresa de negocios, la ciencia de datos tiene el mismo propósito que la inteligencia de negocio hace - para convertir los datos brutos en el conocimiento del negocio que los líderes y gerentes de negocios pueden utilizar para tomar decisiones basadas en datos informados.

Si usted tiene grandes conjuntos de fuentes de datos estructurados y no estructurados que pueden o no ser completa y desea convertir esas fuentes en información valiosa para apoyar las decisiones en toda la empresa, llamar a un científico de datos. la ciencia de datos centrada en el negocio es multidisciplinar e incorpora los siguientes elementos:

  • Análisis cuantitativo: Puede ser en forma de modelación matemática, el análisis estadístico multivariado, previsión y / o simulaciones.

    El termino multivariante se refiere a más de una variable. Un análisis estadístico multivariante es un análisis estadístico simultánea de más de una variable a la vez.

  • Habilidades en programación: Se necesitan las habilidades de programación necesarias tanto para analizar los datos en bruto y hacer estos datos accesibles a los usuarios de negocios.

  • Conocimiento del negocio: Es necesario el conocimiento de la empresa y su entorno de manera que pueda comprender mejor la relevancia de sus resultados.

la ciencia de datos es una disciplina pionera. científicos de datos a menudo emplean el método científico para la exploración de datos, las hipótesis formación y la prueba de hipótesis (a través de la simulación y modelado estadístico). científicos de datos centrados en el negocio generan conocimientos valiosos datos, a menudo mediante la exploración de patrones y anomalías en los datos empresariales. la ciencia de datos en un contexto empresarial que comúnmente se compone de

  • bases de datos internas y externas: la ciencia de datos es flexible. Puede crear datos de negocios combinaciones de datos procedentes de fuentes internas y externas de datos estructurados y no estructurados con bastante facilidad. (UN datos mash-up es una combinación de dos o más fuentes de datos que se analizan a continuación, junto con el fin de proporcionar a los usuarios con una visión más completa de la situación en cuestión.)

  • Herramientas, tecnologías y conjuntos de habilidades: Los ejemplos aquí podrían implicar el uso de plataformas basadas en la nube, la programación matemática y estadística, aprendizaje de máquina, análisis de datos usando Python y R, y visualización avanzada de datos.

Al igual que los analistas de negocios, científicos de datos centrados en el negocio producen productos de soporte de decisiones para los gerentes de empresas y líderes de la organización para su uso. Estos productos incluyen análisis de cuadros de mando y visualizaciones de datos, pero los informes de datos generalmente no tabulares y mesas.

Datos útiles en la ciencia de datos centrada en el negocio

Puede utilizar la ciencia de datos para obtener información del negocio a partir de conjuntos de tamaño estándar de los datos empresariales estructurados (al igual BI) o de conjuntos estructurados, semi-estructurados, no estructurados y de grandes volúmenes de datos. soluciones científicas datos no se limitan a los datos transaccionales que se encuentra en una base de datos- relacional puede utilizar la ciencia de datos para crear información valiosa de todas las fuentes de datos disponibles. Estas fuentes de datos incluyen

  • datos de negocio transaccional: Una fuente de datos probada y, los datos de negocio transaccional es el tipo de datos estructurados utilizados en el BI tradicional e incluye datos de gestión de datos, servicio al cliente, ventas y datos de marketing, datos operativos y datos de rendimiento de los empleados.

  • Los datos sociales relacionados con la marca o negocio: Un fenómeno más reciente, los datos cubiertos por esta rúbrica incluye los datos no estructurados generados a través de mensajes de correo electrónico, mensajería instantánea y las redes sociales como Twitter, Facebook, LinkedIn, Pinterest y Instagram.

  • Datos de máquina de operaciones de negocios: Máquinas generan automáticamente estos datos no estructurados, como datos SCADA, datos de la máquina, o datos del sensor.

    El SCADA acrónimo se refiere a Supervisory doontrol y reATA UNcquisition. sistemas SCADA se utilizan para controlar de forma remota que operan sistemas y equipos mecánicos. Generan datos que se utilizan para supervisar el funcionamiento de las máquinas y equipos.

  • Audio, vídeo, imágenes y archivos PDF de datos: Estos formatos son bien establecidas todas las fuentes de datos no estructurados.

Tecnologías y de habilidades útiles en la ciencia de datos centrada en el negocio

Dado que los productos de la ciencia de datos suelen generarse en grandes volúmenes de datos, soluciones de plataforma de datos basada en la nube son comunes en el campo. Los datos que se utiliza en la ciencia de datos a menudo se deriva de las soluciones de datos grandes de datos de ingeniería, como Hadoop, MapReduce, y procesamiento paralelo masivo.

científicos de datos son, con visión de pensadores innovadores que a menudo deben pensar fuera de la caja con el fin de exigir soluciones a los problemas de los que solucionan. Muchos científicos de datos tienden hacia las soluciones de código abierto cuando esté disponible. Desde un punto de vista económico, este enfoque beneficia a las organizaciones que emplean estos científicos.

científicos de datos centrados en el negocio podrían utilizar técnicas de aprendizaje automático para encontrar patrones en (y obtener ideas de grandes conjuntos de datos) que están relacionados con una línea de negocio o el negocio en general. Son expertos en matemáticas, estadísticas, y la programación, y que a veces utilizan estas habilidades para generar modelos predictivos.

Por lo general, saben cómo programar en Python o R. La mayoría de ellos saben cómo utilizar SQL para consultar datos relevantes de las bases de datos estructuradas. Por lo general son hábiles en la comunicación de ideas de datos a los usuarios finales - en la ciencia de datos centrada en el negocio, los usuarios finales son los gerentes de empresas y líderes de la organización. científicos de datos deben ser hábil en el uso de medios verbales, orales y visuales para transmitir la información de datos valiosos.

Aunque los científicos de datos centrados en el negocio desempeñan un papel de apoyo de decisiones en la empresa, que son diferentes de los analistas de negocio en el que por lo general tienen una sólida formación académica y profesional en matemáticas, la ciencia, la ingeniería, o todo lo anterior. Dicho esto, centrados en el negocio de datos científicos también tienen un gran conocimiento sustantivo de la gestión empresarial.

Artículos Relacionados