La deduplicación de datos en el servidor de ventanas

A partir de Windows Server 2012, Microsoft ha incluido una tecnología innovadora llamada eliminación de datos duplicados, lo que puede reducir drásticamente la cantidad de espacio en disco real que se necesita para almacenar sus datos. Dependiendo del tipo de datos, puede llegar a ahorrar entre un 20 por ciento a más del 80 por ciento. En 20 por ciento de ahorro, de 10 TB de datos consume sólo 8 TB de almacenamiento en disco. En 80 por ciento de ahorro, sólo consume 10 TB 2 TB.

La deduplicación de datos funciona mediante la búsqueda de partes de archivos que son idénticos y almacenar una sola copia de los datos duplicados en el disco. La tecnología necesaria para encontrar y aislar porciones duplicadas de archivos en un disco grande es bastante complicado. Microsoft utiliza un algoritmo llamado fragmentación, que analiza los datos en el disco y lo rompe en trozos cuyo tamaño promedio es de 64 KB. Estos trozos se almacenan en el disco en una carpeta oculta llamada la tienda trozo. A continuación, los archivos reales en el disco contienen punteros a trozos individuales en el almacén trozo. Si dos o más archivos contienen trozos idénticos, sólo una única copia del fragmento se coloca en la tienda trozo y los archivos que comparten el trozo apuntan a la misma porción.

Microsoft ha sintonizado el algoritmo de fragmentación suficiente como para que en la mayoría de los casos, los usuarios no tendrán idea de que sus datos han sido desduplicados. El acceso a los datos es más rápido que si los datos se deduplicaron. Por motivos de rendimiento, los datos no se deduplicaron automáticamente como está escrito. En lugar de ello, los trabajos de eliminación de datos duplicados programadas regularmente escanear el disco, la aplicación del algoritmo de fragmentación para encontrar trozos que pueden ser deduplicaron.

Para utilizar la deduplicación de datos, primero debe activar la función de eliminación de datos duplicados en el Administrador de servidores. En Administrador del servidor, seleccione Agregar funciones y características. Entonces, cuando llegue a la página de funciones de servidor, expanda el rol Servicios de archivos y almacenamiento y seleccione Eliminación de datos duplicados.

Para configurar la deduplicación de datos, abra Administrador del servidor, seleccione Servicios de archivos y almacenamiento, volúmenes clic, a la derecha, haga clic en el volumen que desea deduplicar, y luego seleccione Configurar Eliminación de datos duplicados. Aparece la página Configuración de deduplicación.

Desde esta página, puede activar la deduplicación de datos, excluir ciertos tipos de archivos, y establecer un calendario para los trabajos de eliminación de datos duplicados para correr. Una vez que la deduplicación está configurado, dar tiempo al trabajo de eliminación de datos duplicados para funcionar. Muy pronto, usted comenzará a ver la cantidad de espacio libre en el volumen crece a medida que se deduplicaron los datos.