Las características clave hiveql

La comunidad Apache Hive vibrante y activa continuamente añadirs a un ya amplio conjunto de funciones, lo que hace que la cobertura exhaustiva aún más difícil. La siguiente lista resume algunas de las características clave HiveQL para usted:

Video: HiveQL-Data Manipulation - Hive Query Language - Loading Data in Hive Tables

  • Seguridad: Apache Hive proporciona un subsistema de seguridad que puede ser muy útil en la prevención de la corrupción de datos accidentales o compromiso entre los miembros de confianza de los grupos de trabajo. Sin embargo, el Manual de la colmena Idioma establece claramente que el subsistema de Seguridad de la colmena no está diseñado para evitar que los usuarios nefastos de comprometer un sistema colmena.

    Colmena de seguridad se puede establecer para los usuarios individuales, grupos y funciones administrativas. Colmena ofrece privilegios que se pueden otorgar o revocar a los usuarios, grupos o roles administrativos. La versión 0.10 Colmena mejoró la seguridad en entornos multi-usuario al proporcionar autorización para el meta almacén, y las futuras versiones de la colmena proporcionará el aumento de la integración con el marco de seguridad Hadoop. Kerberos está emergiendo como la tecnología preferida para la fijación de Apache Hadoop.

  • Bloqueo multiusuario: Colmena admite el acceso almacén multiusuario cuando se configura con Apache Zookeeper. Sin este apoyo, un usuario puede leer una tabla a la vez que otro usuario está eliminando esa mesa - que es, obviamente, inaceptable.

    Video: Big Data - An Introduction to Hive and HQL

    acceso multi-usuario está activada a través de variables de configuración en el archivo de sección-site.xml. Una vez configurado, Colmena adquiere de forma implícita a través de las cerraduras Zookeeper para ciertas operaciones de tabla. Los usuarios también pueden gestionar de forma explícita las cerraduras en la colmena de la CLI. Cerraduras y las propiedades de configuración asociados / variables se describen en el Manual de la colmena Language.

  • Compresión: La compresión de datos puede no sólo ahorrar espacio en el HDFS, sino también mejorar el rendimiento al reducir el tamaño global de las operaciones de entrada / salida. Además, la compresión entre los mapeadores y reductores de Hadoop puede mejorar el rendimiento, ya que menos datos se pasan entre los nodos de la agrupación.

    Video: Hive Tutorial 1 | Hive Tutorial for Beginners | Understanding Hive In Depth | Edureka

    Colmena compatible con la compresión intermedia entre los mapeadores y reductores así como la compresión de salida de la tabla. Colmena también entiende cómo ingerir datos comprimidos en el almacén. Los archivos comprimidos con gzip o bzip2 pueden ser leídos por colmena de CARGAR DATOS mando.

  • funciones: HiveQL proporciona un rico conjunto de operadores integrados, funciones integradas, una función de las funciones de agregado, y las funciones de generación de tabla incorporada. Varios ejemplos de este capítulo utilizan incorporados operadores, así como una función de las funciones de agregado (AVG, MIN, y CONTAR, por ejemplo).

    Para una lista de todas las funciones integradas para cualquier versión particular de la colmena, utilice el VER FUNCIONES HiveQL comando. También puede recuperar información acerca de una función incorporada mediante el uso de los comandos HiveQL DESCRIBE LA FUNCIÓN function_name y DESCRIBE función ampliada function_name.

    Utilizando el EXTENDIDO palabra clave devuelve a veces ejemplos de uso para la función incorporada especificada. Además, Colmena permite a los usuarios crear sus propias funciones, llamadas funciones definidas por el usuario, o UDF. Usando marco UDF basadas en Java de la colmena, puede crear funciones adicionales, incluyendo los agregados y las funciones de generación de tabla. Esta característica es una de las razones por las que la colmena puede funcionar como una herramienta ETL.

Artículos Relacionados