Características de un marco de análisis de datos grandes

A pesar de que los nuevos conjuntos de herramientas siguen estando disponibles para ayudarle a gestionar y analizar su marco de grandes volúmenes de datos de manera más eficaz, no puede ser capaz de obtener lo que necesita. Además, una serie de tecnologías puede apoyar el análisis de grandes datos y requisitos tales como la disponibilidad, la escalabilidad y alto rendimiento. Algunos de estos incluyen electrodomésticos grandes de datos, bases de datos de columnas, bases de datos en memoria, bases de datos no relacionales, y motores de procesamiento masivamente paralelo.

Así que, ¿cuáles son los usuarios de negocios que buscan cuando se trata de análisis de datos grande? La respuesta a esta pregunta depende del tipo de problema de negocio que están tratando de resolver. Algunas consideraciones importantes a medida que selecciona un marco de análisis de aplicaciones de grandes datos son los siguientes:

  • Soporte para múltiples tipos de datos: Muchas organizaciones están incorporando, o esperan incorporar, todos los tipos de datos como parte de sus grandes despliegues de datos, incluyendo datos estructurados, semi-estructurados y no estructurados.

  • Manejar el procesamiento por lotes y / o flujos de datos en tiempo real: orientación a la acción es un producto de análisis de flujos de datos en tiempo real, mientras que la orientación decisión puede ser adecuadamente servida por el procesamiento por lotes. Algunos usuarios requerirán tanto, a medida que evolucionan para incluir diferentes formas de análisis.

  • Utilizar lo que ya existe en su entorno: Para obtener el contexto correcto, puede ser importante para aprovechar los datos y algoritmos existentes en el marco de análisis de datos grandes.

  • Apoyar NoSQL y otras formas más recientes de los datos de acceso a: Si bien las organizaciones continuarán utilizando SQL, muchos también están estudiando nuevas formas de acceso a datos para apoyar los tiempos de respuesta más rápidos o tiempos más rápidos de decisión.

  • Superar la baja latencia: Si vas a estar tratando con alta velocidad de datos, vas a necesitar un marco que puede soportar los requisitos de velocidad y rendimiento.

  • Proporcionar un almacenamiento barato: grandes datos potencialmente significa un montón de almacenamiento - en función de la cantidad de datos que desea procesar y / o mantener.

  • Integración con implementaciones de la nube: La nube puede proporcionar almacenamiento y calcular la capacidad bajo demanda. Cada vez más empresas están usando la nube como un análisis “caja de arena”. Cada vez más, la nube se está convirtiendo en un importante modelo de implementación para integrar los sistemas existentes con implementaciones de la nube en un modelo híbrido.

Si bien todas estas características son importantes, el valor percibido y real de la creación de aplicaciones de un marco de tiempo es más rápido para el despliegue. Con todas estas capacidades en mente, considere un marco de aplicación de análisis de grandes volúmenes de datos de una empresa llamada Continuidad.

los continuidad AppFabric es un marco de apoyo al desarrollo y despliegue de aplicaciones de datos grandes. El AppFabric en sí es un conjunto de tecnologías diseñadas específicamente para abstraer los caprichos de las grandes tecnologías de datos de bajo nivel. El generador de aplicaciones es un Eclipse plug-in que permite al desarrollador para construir, probar y depurar a nivel local y en un entorno familiar.

capacidades AppFabric incluyen los siguientes:

  • de soporte de flujo para el análisis en tiempo real y de reacción

  • API unificada, lo que elimina la necesidad de escribir a las infraestructuras de datos grandes

  • interfaces de consulta de resultados simples y soporte para procesadores de consultas conectables

  • Los conjuntos de datos que representan datos y tablas consultables accesibles desde la API unificada

  • Lectura y escritura de datos independientes de formatos de entrada o de salida o específicos de los componentes subyacentes

  • procesamiento de eventos basado en transacciones

  • despliegue Multimodal a un solo nodo o la nube

Video: Motorola Moto G4 Play, review en español

Este enfoque va a ganar tracción para el desarrollo de grandes aplicaciones de datos, principalmente debido a la gran cantidad de herramientas y tecnologías necesarias para crear un entorno de datos grande.

La falta de colaboración puede ser costoso en muchos sentidos. Las grandes organizaciones pueden beneficiarse de las herramientas que impulsan colaboraciones. Muy a menudo las personas que desempeñan funciones análogas no son conscientes de los esfuerzos de cada uno que conducen a duplicar el trabajo.

Otro buen ejemplo de un marco de aplicación es OpenChorus. Además de rápido desarrollo de aplicaciones de análisis de datos grandes, también apoya la colaboración y ofrece muchas otras características importantes para los desarrolladores de software, al igual que la integración de herramientas, control de versiones y gestión de la configuración.

Coro Abierto es un proyecto mantenido por EMC Corporation y está disponible bajo la licencia Apache 2.0. EMC también produce y es compatible con una versión comercial de Coro. Tanto Coro Coro Abierto y tienen redes de socios vibrantes, así como un amplio conjunto de contribuyentes individuales y corporativos.

Coro abierto es un marco genérico. Su principal característica es la capacidad de crear un “hub” comunal para compartir grandes fuentes de datos, ideas, técnicas de análisis y visualizaciones. Coro abierta proporciona lo siguiente:

  • Repositorio de herramientas de análisis, artefactos y técnicas con versiones completa, el seguimiento de cambios, y el archivo

  • Espacios de trabajo y cajones de arena que son auto-aprovisionamiento y mantenido por miembros de la comunidad con facilidad

  • Visualizaciones, incluyendo mapas de calor, series de tiempo, histogramas, etc.

    Video: Sony Xperia T2 Ultra, Análisis y experiencia de uso en Español

  • La búsqueda federada de cualquier y todos los activos de datos, incluyendo Hadoop, metadatos, repositorios SQL y comentarios

    Video: Samsung GALAXY S8 | 8 novedades, características y rumores

  • La colaboración a través de redes sociales características similares alentadores descubrimiento, el intercambio y la lluvia de ideas

  • Extensibilidad para la integración de componentes y tecnologías de terceros

Artículos Relacionados