¿Qué es Storage Spaces Direct (S2D)?
En algún momento, todos los discos duros acaban llenándose. Storage Spaces Direct es un método que sirve para unir varios discos duros de manera lógica para que parezcan una sola gran unidad de disco a ojos del usuario. El usuario ya no tiene que preocuparse por la ubicación física del almacenamiento de sus datos, ya que los servidores gestionan el sistema de archivos S2D de forma automática. Este sistema exige una fiabilidad contra caídas muy elevada por parte de los componentes empleados.
Storage Spaces Direct, en español, espacio de almacenamiento directo, permite agrupar los soportes de datos de diferentes servidores de Windows en un único clúster de almacenamiento que luego se divide en unidades de disco lógicas que se habilitan para los usuarios. En este contexto, el software es el encargado de controlar las unidades de disco, lo que implica ciertos requisitos a la hora de escoger el hardware.
Requisitos para Storage Spaces Direct (S2D)
Storage Spaces Direct (S2D) es un tipo de almacenamiento definido por software de Windows Server 2016, por lo que no puede ejecutar en cualquier ordenador con Windows. La tecnología está basada en los espacios de almacenamiento que Microsoft introdujo ya en Windows Server 2012, en aquel entonces, todavía con el Scale Out File Server (SOFS), un servidor de archivos de escalado horizontal.
Para usar Storage Spaces Direct (S2D) hacen falta varios discos duros en un servidor o varios servidores con uno o varios discos duros cada uno. Los servidores pueden conectarse por Ethernet, así que no hacen falta cables especiales. Como unidades de disco pueden utilizarse discos duros clásicos (HDD), SSD o tarjetas de memoria NVMe.
Storage Spaces Direct se abrevia “S2D”. Esto se debe principalmente a que la abreviatura “SSD” ya existe. SSD significa Solid State Drive, un conocido tipo de almacenamiento de semiconductores. Para los usuarios, los SSD tienen el mismo aspecto que las unidades de disco, pero a diferencia de los discos duros, no usan componentes mecánicos.
Selección correcta de los componentes de hardware para Storage Spaces Direct (S2D)
Para que los componentes de hardware interactúen de manera armonizada, todos los equipos y controladores de Microsoft necesitan un certificado Windows Server 2016 para usar Storage Spaces Direct. Microsoft cuenta con una lista de servidores preconfigurados de diferentes proveedores. Todos ellos cumplen los requisitos de Windows Server 2016: sistemas hiperconvergentes. Otra posibilidad es reunir los componentes adecuados por cuenta propia. En este caso, debes usar componentes certificados por el Software-Defined Data Center (SDDC) de Microsoft.
El Intel Nehalem, o el similar AMD EPYC, cumplen los requisitos mínimos para procesadores usados en los servidores. Además del espacio de almacenamiento requerido por un servidor Windows que cumpla los mismos requisitos, un nodo Storage Spaces Direct necesita 4 GB de memoria RAM por cada TB de caché de la unidad de disco.
Los discos duros o SSD pueden conectarse mediante SAS o SATA. Las unidades USB no son compatibles y tampoco pueden utilizarse controladores RAID, ya que la activación del hardware se realiza exclusivamente a través de la capa de software de Storage Spaces Direct. Las unidades de disco deben estar conectadas físicamente al servidor, no es posible integrar espacios de almacenamiento de red (NAS, Network Attached Storage).
Para guardar datos a los que se accede a menudo o que se modifican con frecuencia, lo más recomendable es usar SSD en los servidores. En este caso, deben usarse SSD Enterprise compatibles con Power Loss Protection, es decir, unas que no generen errores en el sistema de archivos en caso de que se interrumpa la alimentación de la corriente. Al usar SSD o NVMe, todas las unidades de disco montadas se deben encontrar en un nodo del mismo tipo.
Infraestructura de red para Storage Spaces Direct (S2D)
Para permitir la comunicación dentro de un clúster, los diferentes nodos deben estar conectados al menos mediante una red de 10 GBit. Las tarjetas de red empleadas deben ser compatibles con RDMA (Remote Direct Memory Access) con los protocolos RoCE o iWARP. A la hora de conectar las estaciones de trabajo a la red, se aplican las especificaciones habituales para redes de Windows Server.
¿Cuál es la composición de Storage Spaces Direct (S2D)?
Los espacios de almacenamiento directo constan de al menos dos nodos. Estos nodos son hardware de servidor estándar certificado por Microsoft en el que se ejecuta Windows Server 2016. Cada uno de los nodos cuenta con un mínimo de dos unidades de disco montadas. Debes instalar la función Failover Cluster Feature en Windows Server 2016 para protegerte contra fallos de hardware.
¿Cuándo se utiliza Storage Spaces Direct (S2D)?
Los espacios de almacenamiento directo son perfectos para aumentar de manera flexible las capacidades de almacenamiento en red y para garantizar una seguridad de datos elevada en caso de fallos de hardware. De esta forma, los datos están disponibles simultáneamente en diferentes ubicaciones de la empresa, siempre y cuando exista una conexión de red rápida entre las ubicaciones.
Otro ámbito de aplicación son las máquinas virtuales basadas en la tecnología Hyper-V en red, ya que con Storage Spaces Direct se pueden escalar de manera más sencilla. De esta forma, varias máquinas virtuales pueden acceder a los mismos datos.
¿Cómo funciona Storage Spaces Direct (S2D)?
Storage Spaces Direct (S2D) es una solución de almacenamiento definido por software en la que un software se encarga de gestionar los medios de almacenamiento del hardware. Así, las capacidades de almacenamiento y las ventajas técnicas de los diferentes soportes de datos pueden agruparse de forma centralizada, incluso si están conectados a diferentes servidores en diferentes espacios. De esta manera, el servidor y los soportes se agrupan en un Storage Space Direct Cluster.
Si se utilizan diferentes tecnologías de almacenamiento, el software decide automáticamente qué datos se almacenan en qué hardware. Los archivos a los que se accede a menudo, se almacenan en soportes NVMe rápidos, los archivos que se modifican con frecuencia, en SSD, y las copias de seguridad y los datos a los que se accede con poca frecuencia, en discos duros clásicos.
Como memoria caché también deben usarse en la medida de lo posible soportes SSD o NVMe. Los usuarios de la red ven todo el Clúster como un solo elemento de red habilitado. No tienen que preocuparse por qué datos se encuentran en cada hardware.
IONOS Enterprise Cloud también ofrece tecnología de almacenamiento definido por software a pequeñas y medianas empresas que no disponen de servidor propio. En esta nube comercial puedes escalar los recursos que necesitas por tu cuenta y en cualquier momento con el Data Center Designer.
La administración se lleva a cabo en el servidor, mediante la herramienta gráfica “Server Manager” del sistema operativo Windows Server 2016 o a través de la línea de comandos. Durante la instalación del Storage Space Direct Cluster, antes que nada, se agrupan todos los discos duros de los diferentes servidores en un Storage Pool. Es importante que solo se integren en el clúster aquellas unidades de disco que contienen datos de usuario. Las unidades de disco del sistema operativo de los servidores permanecen independientes.
Los discos duros y soportes de almacenamiento de semiconductores adecuados se detectan y añaden automáticamente. De esta forma, más adelante, pueden integrarse más discos duros y servidores en el clúster para escalar la capacidad de almacenamiento según haga falta. Cada nodo permite integrar cuatro unidades de disco de datos y dos unidades de disco de caché aparte del disco duro del sistema.
En el nuevo clúster se crean discos virtuales que aquí se denominan Cluster Shared Volume (CSV). A continuación, se formatean estos CSV, un proceso que permite dos sistemas de archivos. Microsoft recomienda el CSV-ReFS (Resilient File System), porque se adapta mejor a la tecnología Storage Spaces Direct que el CSV-NTFS, basado en el clásico NTFS para discos duros. Los CSV pueden extenderse por varias unidades de disco de hardware, pero esto no afecta al usuario dado que todas son gestionadas por el sistema.
Cada nodo Storage Space Direct puede alcanzar una capacidad total de almacenamiento de hasta 100 TB. Un Storage Pool de varios servidores solo puede usar una capacidad máxima de 1 PB (PetaByte = 1024 TB), a pesar de que Storage Spaces Direct (S2D) permite hasta 16 servidores.
La comunicación de red entre los distintos nodos se realiza a través del protocolo SMB3, una evolución del Server Message Block (SMB) con SMB Direct y SMB Multichannel.
También es posible unir varios discos duros en una sola unidad de disco en un ordenador de Windows convencional. En este caso, la solución son los soportes de datos dinámicos. En la gestión de soportes de datos de Windows 10, los discos duros existentes pueden convertirse en soportes de datos dinámicos. A continuación, estos soportes pueden agruparse en una unidad de disco lógica. También pueden realizarse automáticamente copias espejo de los datos. Sin embargo, sin un nuevo formateo, no hay vuelta atrás.
¿Cómo protege Storage Spaces Direct (S2D) frente a las caídas?
A través de la función Failover Cluster Feature de Windows Server 2016, los espacios de almacenamiento directo ofrecen una serie de medidas para proteger los datos almacenados contra fallos de hardware. De esta manera, si hay un fallo en un disco duro o en un nodo entero, no se pierde ningún dato y el sistema sigue funcionando en su conjunto. En la mayoría de los casos, los usuarios ni se enteran del fallo de hardware.
Cuando un clúster está formado solo por dos nodos, se crean copias espejo de doble vía que sincronizan los datos de ambos nodos, de manera que un nodo o un disco duro puede dejar de funcionar completamente sin suponer ningún problema. A partir de tres nodos, es recomendable realizar una creación de copias espejo de triple vía.
En este último caso, no hay problema si uno de los tres nodos deja de funcionar completamente y en otro hay varios discos duros que no funcionan. Sin embargo, nunca debe verse afectada más de la mitad del total de las unidades de disco de datos, ya que entonces, deja de asegurarse la consistencia de los datos. Esta norma no se aplica a los fallos en los discos duros del sistema operativo, ya que estos equivalen a un fallo de un servidor.
Resumen de las ventajas de Storage Space Direct (S2D)
- Buena posibilidad de escalado, pueden añadirse más servidores sin problema.
- Alta disponibilidad gracias a copias espejo de los datos; los fallos de hardware no implican pérdida alguna de datos.
- A diferencia de soluciones similares de otros fabricantes, puede usar hardware de servidor estándar siempre y cuando cuente con la certificación de Microsoft.
- El sistema ha sido optimizado para servidores SQL y virtualizaciones con Hyper-V.