Cómo establecer la base arquitectónica de grandes volúmenes de datos

Video: COMO CREAR UN FORMULARIO BASE DE DATOS MACRO EXCEL 2007 1/2

Es importante establecer una sólida base arquitectónica si usted quiere tener éxito con grandes volúmenes de datos. Además de ser compatible con los requisitos funcionales, es importante para apoyar el rendimiento requerido. Sus necesidades dependerán de la naturaleza del análisis que está apoyando. Necesitará la cantidad correcta de potencia de cálculo y la velocidad.

Su arquitectura también tiene que tener la cantidad adecuada de redundancia de manera que usted está protegido de latencia no anticipado y el tiempo de inactividad.

Comience haciéndose las siguientes preguntas:

  • La cantidad de datos será su organización necesita para gestionar hoy y en el futuro?

  • ¿Con qué frecuencia su organización necesita para administrar los datos en tiempo real o casi en tiempo real?

  • ¿Cuánto riesgo puede permitirse su organización? Es el sector sujeto a estrictas medidas de seguridad, cumplimiento de normas y requisitos de gobierno?

  • ¿Qué tan importante es la velocidad a la necesidad de gestionar los datos?

  • Cómo ciertos precisa o ¿Los datos tienen que ser?

Interfaces y alimentos para grandes volúmenes de datos

Para entender cómo funciona grandes volúmenes de datos en el mundo real, es importante empezar por entender la necesidad de interfaces y alimentos. De hecho, lo que hace que grandes volúmenes de datos tan grande es el hecho de que se basa en recoger una gran cantidad de datos de muchas fuentes.

Por lo tanto, las interfaces de programación de aplicaciones (API) será fundamental para cualquier arquitectura de grandes volúmenes de datos. Además, tener en cuenta que existen las interfaces en todos los niveles y entre cada capa de la pila. Sin servicios de integración, los datos grandes no pueden pasar.

infraestructura física de grandes datos redundantes

La infraestructura física de apoyo es fundamental para el funcionamiento y la escalabilidad de una arquitectura de grandes volúmenes de datos. De hecho, sin la disponibilidad de infraestructuras físicas sólidas, grandes volúmenes de datos probablemente no se han convertido en una tendencia tan importante. Para apoyar un volumen imprevisto o imprevisible de los datos, una infraestructura física para grandes volúmenes de datos tiene que ser diferente a la de los datos tradicionales.

La infraestructura física se basa en un modelo de computación distribuida. Esto significa que los datos pueden ser almacenados físicamente en muchos lugares diferentes y pueden ser unidos entre sí a través de redes, el uso de un sistema de archivos distribuido, y varias herramientas y aplicaciones de análisis de datos grandes.

La redundancia es importante porque se trata de tantos datos de tantas fuentes diferentes. La redundancia viene en muchas formas. Si su empresa ha creado una nube privada, tendrá que tener redundancia incorporada dentro del ámbito privado para que pueda escalar para soportar cargas de trabajo cambiantes.

Si su empresa quiere contener el crecimiento interno de TI, puede utilizar los servicios de nube externos para aumentar sus recursos internos. En algunos casos, esta redundancia puede venir en forma de un Software como un Servicio (SaaS) que permite a las empresas para hacer el análisis de datos sofisticados como un servicio. El enfoque SaaS ofrece menores costos de puesta en marcha, más rápido y sin problemas evolución de la tecnología subyacente.

infraestructura de seguridad de datos grande

Cuanto más importante es el análisis de datos se convierte en grande a las empresas, tanto más importante será asegurar que los datos. Por ejemplo, si usted es una compañía de salud, es probable que desee utilizar aplicaciones de grandes volúmenes de datos para determinar los cambios en la demografía o los cambios en las necesidades del paciente. Estos datos acerca de sus constituyentes necesita ser protegido tanto para satisfacer los requisitos de cumplimiento y proteger la privacidad de los pacientes.

Tendrá que tener en cuenta que se le permite ver los datos y en qué circunstancias se les permite hacerlo. Tendrá que ser capaz de verificar la identidad de los usuarios, así como proteger la identidad de los pacientes.

grandes fuentes de datos operacionales

Es importante entender que hay que incorporar todas las fuentes de datos que le dará una visión completa de su negocio y ver cómo los impactos de datos de la forma en que opera su negocio. A medida que el mundo cambia, es importante entender que los datos operativos ahora tiene que abarcar una gama más amplia de fuentes de datos, incluyendo fuentes no estructuradas, tales como datos de medios sociales en todas sus formas.

A encontrar nuevos enfoques emergentes para la gestión de datos en el gran mundo de los datos, incluyendo documentos, gráfico, columnar, y arquitecturas de bases de datos geoespaciales. En conjunto, estos se denominan NoSQL, o no sólo SQL, bases de datos. En esencia, es necesario mapear las arquitecturas de datos a los tipos de transacciones.

Si lo hace, le ayudará a asegurar la derecho se dispone de datos cuando lo necesite. También es necesario arquitecturas de datos que apoyan el contenido no estructurado complejo. Es necesario incluir ambas bases de datos relacionales y bases de datos no relacionales en su enfoque de aprovechamiento de grandes volúmenes de datos. También es necesario incluir fuentes de datos no estructurados, como los sistemas de gestión de contenidos, por lo que puede estar más cerca de ese punto de vista de negocio de 360 ​​grados.

Todas estas fuentes de datos operacionales tienen varias características en común:

  • Representan los sistemas de registro que mantienen un registro de los datos críticos necesarios para el tiempo real, la operación del día a día del negocio.

  • Se actualizan continuamente sobre la base de las transacciones que ocurren dentro de las unidades de negocio y de la web.

  • Por estas fuentes para proporcionar una representación exacta de la empresa, deben entremezclarse datos estructurados y no estructurados.

  • Estos sistemas también deben ser capaces de escalar para soportar miles de usuarios en una base consistente. Estos podrían incluir sistemas de transacciones de comercio electrónico, sistemas de gestión de relaciones con los clientes o aplicaciones de centro de llamadas.

Artículos Relacionados