El primer disco duro del mundo, el IBM RAMAC 305, que se lanzó en 1956, contenía solo 5 MB de datos y, al mismo tiempo, pesaba 970 kg y era comparable en tamaño a un refrigerador industrial. Los buques insignia corporativos modernos tienen una capacidad de 20 TB. Imagínese: hace 64 años, para registrar tal cantidad de información, se necesitarían más de 4 millones de RAMAC 305, y el tamaño del centro de datos requerido para su ubicación superaría los 9 kilómetros cuadrados, mientras que hoy una pequeña caja que pesa aproximadamente 700 gramos! Gran parte de este increíble aumento en la densidad de almacenamiento se ha logrado gracias a los avances en las técnicas de grabación magnética.
Es difícil de creer, pero el diseño de los discos duros no ha cambiado fundamentalmente durante casi 40 años, a partir de 1983: fue entonces cuando vio la luz el primer disco duro RO351 de 3,5 pulgadas, desarrollado por la empresa escocesa Rodime. Este niño recibió dos placas magnéticas de 10 MB cada una, es decir, pudo contener el doble de datos que el ST-412 actualizado de 5.25 pulgadas, lanzado por Seagate en el mismo año para computadoras personales IBM 5160.
Rodime RO351: el primer disco duro de 3,5 pulgadas del mundo
A pesar de su innovación y tamaño compacto, en el momento de su lanzamiento, el RO351 resultó ser prácticamente inútil, y todos los intentos posteriores de Rodime para afianzarse en el mercado de los discos duros fracasaron, razón por la cual en 1991 la empresa fue obligado a cesar sus actividades, habiendo vendido casi todos los activos disponibles y reducido la plantilla al mínimo. Sin embargo, Rodime no estaba destinado a la quiebra: pronto los mayores fabricantes de discos duros comenzaron a recurrir a él, deseando adquirir una licencia para utilizar el factor de forma patentado por los escoceses. 3,5 pulgadas es actualmente el estándar aceptado tanto para HDD de consumidores como para empresas.
Con la llegada de las redes neuronales, el aprendizaje profundo y el Internet de las cosas (IoT), la cantidad de datos creados por la humanidad comenzó a crecer como una avalancha. Según la agencia analítica IDC, para el 2025 la cantidad de información generada tanto por las propias personas como por los dispositivos que nos rodean alcanzará los 175 zettabytes (1 ZB = 10 21 bytes), y esto a pesar de que en 2019 fue de 45 ZB. en 2016 - 16 ZB, y en 2006 la cantidad total de datos producidos en toda la historia previsible no superó 0,16 (!) ZB. Las tecnologías modernas ayudan a hacer frente a la explosión de la información, entre las cuales los métodos avanzados de registro de datos no son los últimos.
LMR, PMR, CMR y TDMR: ¿cuál es la diferencia?
El principio de funcionamiento de los discos duros es bastante simple. Placas de metal delgadas recubiertas con una capa de material ferromagnético (una sustancia cristalina capaz de retener la magnetización incluso cuando no está expuesta a un campo magnético externo a temperaturas por debajo del punto de Curie) se mueven con respecto al bloque de cabezales de escritura a alta velocidad (5400 rpm o más). Cuando se aplica una corriente eléctrica al cabezal de escritura, surge un campo magnético alterno, que cambia la dirección del vector de magnetización de los dominios (regiones discretas de la sustancia) del ferromaimán. La lectura de datos se produce debido al fenómeno de inducción electromagnética (el movimiento de dominios en relación con el sensor provoca una corriente eléctrica alterna en este último),o por el gigantesco efecto magnetorresistivo (la resistencia eléctrica del sensor cambia bajo la acción de un campo magnético), como se implementa en los dispositivos de almacenamiento modernos. Cada dominio codifica un bit de información, tomando un valor lógico "0" o "1" dependiendo de la dirección del vector de magnetización.
Durante mucho tiempo, los discos duros utilizaron el método de grabación magnética longitudinal (LMR), en el que el vector de magnetización de dominio estaba en el plano de la placa magnética. A pesar de la relativa simplicidad de implementación, esta tecnología tenía un inconveniente importante: para superar la coercitividad (la transición de partículas magnéticas a un estado de dominio único), se tuvo que dejar una zona de amortiguación impresionante entre las pistas (el llamado espacio de guardia). Como resultado, la densidad de grabación máxima que se logró al final de esta tecnología fue de solo 150 Gbit / pulgada 2 .
En 2010, LMR fue reemplazado casi por completo por PMR (Grabación magnética perpendicular - grabación magnética perpendicular). La principal diferencia entre esta tecnología y el registro magnético longitudinal es que el vector de la dirección magnética de cada dominio se ubica en un ángulo de 90 ° con respecto a la superficie de la placa magnética, lo que redujo significativamente el espacio entre las pistas.
Debido a esto, la densidad de grabación de datos se incrementó significativamente (hasta 1 Tbit / pulgada 2en dispositivos modernos), sin sacrificar las características de velocidad y confiabilidad de los discos duros. Actualmente, la grabación magnética perpendicular es dominante en el mercado, por lo que a menudo también se la denomina CMR (grabación magnética convencional). Debe entenderse que no hay absolutamente ninguna diferencia entre PMR y CMR; esta es solo otra versión del nombre.
Mientras estudia las especificaciones técnicas de los discos duros modernos, también puede tropezar con la misteriosa abreviatura TDMR. En particular, esta tecnología es utilizada por los variadores de la serie Western Digital Ultrastar 500 de clase empresarial . Desde el punto de vista de la física, TDMR (que significa grabación magnética bidimensional) no es diferente del PMR al que estamos acostumbrados: como antes, estamos tratando con pistas disjuntas, los dominios en los que están orientados perpendicularmente al plano de las placas magnéticas. La diferencia entre tecnologías radica en el enfoque para leer la información.
En el bloque de cabezales magnéticos de discos duros, creado con la tecnología TDMR, hay dos sensores de lectura para cada cabezal de grabación, que leen simultáneamente los datos de cada pista pasada. Esta redundancia permite al controlador HDD filtrar de manera eficiente el ruido electromagnético causado por la interferencia Intertrack (ITI).
Resolver el problema de ITI proporciona dos beneficios extremadamente importantes:
- La reducción de la relación de ruido le permite aumentar la densidad de grabación al reducir la distancia entre pistas, lo que proporciona una ganancia en la capacidad total de hasta un 10% sobre la PMR convencional;
- RVS , TDMR , , .
SMR ?
El tamaño del cabezal de escritura es aproximadamente 1,7 veces el tamaño del sensor de lectura. Una diferencia tan impresionante se puede explicar de manera bastante simple: si el módulo de grabación se hace aún más en miniatura, la fuerza del campo magnético que puede generar no será suficiente para magnetizar los dominios de la capa ferromagnética, lo que significa que los datos simplemente no se guardarán. En el caso de un sensor de lectura, este problema no surge. Además: su miniaturización permite reducir aún más la influencia del ITI antes mencionado en el proceso de lectura de la información.
Este hecho formó la base de Shingled Magnetic Recording (SMR). Averigüemos cómo funciona. Con el PMR tradicional, la cabeza se desplaza de cada pista anterior por una distancia igual a su ancho + el ancho del espacio de guarda.
Cuando se utiliza el método de grabación magnética en mosaico, el cabezal de grabación se mueve hacia adelante solo una parte de su ancho, por lo que cada pista anterior se sobrescribe parcialmente con la siguiente: las pistas magnéticas se superponen entre sí como una teja. Este enfoque le permite aumentar aún más la densidad de grabación, proporcionando una ganancia de capacidad de hasta un 10%, sin afectar el proceso de lectura. Un ejemplo es el Western Digital Ultrastar DC HC 650 , las primeras unidades SATA / SAS de 20 TB y 3,5 pulgadas del mundo, que son posibles gracias a la nueva tecnología de grabación magnética. Por lo tanto, la transición a unidades SMR le permite aumentar la densidad de almacenamiento en los mismos racks con costos mínimos para actualizar la infraestructura de TI.
A pesar de una ventaja tan significativa, el SMR también tiene un inconveniente obvio. Dado que las pistas magnéticas se superponen entre sí, la actualización de los datos requerirá reescribir no solo el fragmento requerido, sino también todas las pistas posteriores dentro de la placa magnética, cuyo volumen puede exceder los 2 terabytes, lo que está plagado de una seria caída en el rendimiento.
La combinación de un cierto número de pistas en grupos separados llamados zonas ayuda a resolver este problema. Aunque este enfoque para organizar el almacenamiento de datos reduce algo la capacidad total del disco duro (ya que es necesario mantener suficientes espacios entre zonas para evitar la reescritura de pistas de grupos vecinos), puede acelerar significativamente el proceso de actualización de datos, ya que ahora solo un número limitado de pistas está involucrado en él.
La grabación magnética en mosaico sugiere varias opciones de implementación:
- Drive Managed SMR (Drive Managed SMR)
Su principal ventaja es que no es necesario modificar el software y / o hardware del host, ya que el control del procedimiento de grabación de datos lo asume el controlador HDD. Dichas unidades se pueden conectar a cualquier sistema que tenga la interfaz requerida (SATA o SAS), después de lo cual la unidad estará lista para su uso inmediatamente.
La desventaja de este enfoque es la variabilidad en los niveles de rendimiento, lo que hace que Drive Managed SMR no sea adecuado para aplicaciones empresariales donde la coherencia del rendimiento del sistema es fundamental. Sin embargo, estos discos funcionan bien en escenarios que permiten suficiente tiempo para realizar la desfragmentación en segundo plano de los datos. Por ejemplo, unidades WD Red DMSMROptimizados para su uso en pequeños sistemas NAS de 8 bahías, son una excelente opción para sistemas de archivo o respaldo que requieren almacenamiento a largo plazo de respaldos.
- SMR administrado por host (SMR administrado por host)
Host Managed SMR es la implementación de grabación en mosaico preferida para su uso en un entorno corporativo. En este caso, el propio sistema host se encarga de administrar los flujos de datos y las operaciones de lectura / escritura, utilizando para estos fines las interfaces ATA (Zoned Device ATA Command Set, ZAC) y SCSI (Zoned Block Commands, ZBC), desarrolladas por INCITS T10 y T13. ...
Cuando se utiliza HMSMR, todo el espacio de almacenamiento disponible se divide en dos tipos de zonas: las zonas convencionales, que se utilizan para almacenar metadatos y escrituras aleatorias (de hecho, actúan como caché), y las zonas de escritura secuencial requerida, que ocupan una gran cantidad de parte de la capacidad total del disco duro en la que los datos se escriben de forma estrictamente secuencial. Los datos desordenados se almacenan en un área en caché, desde donde luego se pueden transferir al área de escritura secuencial correspondiente. Esto permite que todos los sectores físicos se escriban secuencialmente en la dirección radial y se sobrescriban solo después de la transferencia cíclica, lo que permite un rendimiento del sistema estable y predecible. Al mismo tiempo, los discos HMSMR admiten comandos de lectura aleatorios de manera similar a las unidades,utilizando PMR estándar.
Host Managed SMR se implementa en discos duros de la serie Western Digital Ultrastar HC DC 600 de clase empresarial .
La línea incluye unidades SATA y SAS de alta capacidad para su uso en centros de datos de hiperescala. La compatibilidad con Host Managed SMR amplía significativamente el alcance de dichas unidades: además de los sistemas de respaldo, son perfectos para almacenamiento en la nube, CDN o plataformas de transmisión. La alta capacidad de los discos duros le permite aumentar significativamente la densidad de almacenamiento (en los mismos racks) con costos mínimos de actualización y bajo consumo de energía (no más de 0.29 vatios por cada terabyte de información almacenada) y disipación de calor (en promedio 5 ° C más bajo que el de análogos): para reducir aún más los costos operativos de mantenimiento del centro de datos.
El único inconveniente de HMSMR es la relativa complejidad de implementación. El caso es que hoy en día ningún sistema operativo o aplicación es capaz de trabajar con tales unidades "fuera de la caja", por lo que se requieren cambios serios en la pila de software para adaptar la infraestructura de TI. En primer lugar, esto concierne, por supuesto, al sistema operativo en sí, que en los centros de datos modernos que utilizan servidores de varios núcleos y varios sockets es una tarea bastante sencilla. Para obtener más información sobre las opciones para implementar el soporte SMR administrado por host , visite ZonedStorage.io , un recurso de almacenamiento zonal dedicado. La información recopilada aquí le ayudará a evaluar previamente la preparación de su infraestructura de TI para la migración a sistemas de almacenamiento por zonas.
- Host Aware SMR (SMR compatible con host)
Los dispositivos habilitados para Host Aware SMR combinan la conveniencia y flexibilidad de Drive Managed SMR con la alta velocidad de escritura de Host Managed SMR. Estas unidades son compatibles con versiones anteriores de los sistemas de almacenamiento heredados y pueden funcionar sin control directo del host, pero en este caso, al igual que con las unidades DMSMR, su rendimiento se vuelve impredecible.
Al igual que el SMR administrado por el host, el SMR consciente del host utiliza dos tipos de zonas: Zonas convencionales para escrituras aleatorias y Zonas preferidas de escritura secuencial. Estas últimas, a diferencia de las Zonas Requeridas de Escritura Secuencial mencionadas anteriormente, se transfieren automáticamente a la categoría de regulares en el caso de que se comience a realizar un registro de datos desordenado en ellas.
Una implementación SMR asistida por host proporciona mecanismos internos para recuperarse de una escritura inconsistente. Los datos desordenados se escriben en el área de caché, desde donde el disco puede transferir información al área de escritura secuencial después de que se hayan recibido todos los bloques necesarios. El disco usa una tabla de direccionamiento indirecto para administrar escrituras fuera de orden y desfragmentación en segundo plano. Sin embargo, si las aplicaciones empresariales requieren un rendimiento optimizado y predecible, esto solo se puede lograr cuando el host toma el control total de todos los flujos de datos y las zonas de escritura.