"¡Hágase la luz!", O cómo cambiamos el sistema UPS en el centro de datos en medio de una pandemia









- COVID-19 – , . , , -. 



, - . 









Delta Linxdatacenter





El sistema de alimentación ininterrumpida (UPS) de nuestro centro de datos en San Petersburgo fue diseñado originalmente según el modelo 2N. 



Esto significa que si un SAI falla (o se apaga por mantenimiento), el otro se hace cargo de la carga completa. En consecuencia, la potencia utilizada real de una fuente de alimentación ininterrumpida (UPS) en un par no debe exceder el 50% del máximo disponible. Esto asegura la confiabilidad del sistema. 



En funcionamiento normal, los SAI proporcionan el 100% de potencia necesaria, compartiendo la carga por igual. 



Sin embargo, el crecimiento de las cargas en el centro de datos llevó a la necesidad de modernización: el nivel de consumo de capacidad se acercaba al umbral máximo permitido. 



Debido a la alta demanda de los recursos del sitio, tomamos una decisión a favor de los UPS modulares como un formato que responde de manera óptima a los desafíos del desarrollo del centro de datos en el momento actual y permite incrementar la capacidad en el futuro. 



Al mismo tiempo, resultó imposible implementar UPS modulares en el UPS construido sobre soluciones monobloque. Sería necesario desconectar algunos de los equipos, lo que provocaría un tiempo de inactividad de los sistemas de TI de los clientes, por lo que descartamos este escenario de inmediato. 



Era necesario crear un SAI fundamentalmente nuevo, redistribuyendo la carga entre los SAI monobloque existentes y los nuevos modulares. Al mismo tiempo, era importante cumplir con los requisitos del Uptime Institute en términos de monitoreo de cargas: hasta el 50% del máximo por unidad UPS. 



Elección a favor



La elección recayó en el equipo de Delta Electronics: el modelo de UPS requerido Delta DPH 500 kVA estaba disponible en un almacén en San Petersburgo, y el integrador de soluciones (Tempesto Group of Companies) también tenía el estatus de distribuidor monomarca del proveedor en Rusia, lo que jugó un papel importante para nosotros en el camino. proyecto. 



El formato modular del UPS le permite resolver muchos problemas relacionados con la fuente de alimentación del centro de datos, el principal de los cuales es aumentar la tolerancia a fallas. 



El hecho es que los SAI monobloque fallan por completo, provocando un "efecto dominó" a lo largo de toda la cadena de cumplimiento de SLA. Por el contrario, los SAI modulares en caso de emergencia "vuelan" modularmente, perdiendo 50 kW cada uno, lo que, con la configuración adecuada de la arquitectura del SAI, le permite no sentir las consecuencias de tales fallas y, en algunos casos, el efecto de tal accidente tenderá a cero. 



Además, las soluciones modulares permiten el reemplazo de módulos defectuosos "en caliente", son fácilmente escalables a cargas fluctuantes en la sala de computadoras y son mucho más compactas (un UPS modular ocupa un rack versus 2,5 racks para un dispositivo monobloque). El factor económico también es importante: las soluciones modulares cuestan casi la mitad del precio en comparación con los modelos monobloque líderes del mercado.  



En resumen, fue una elección bastante fácil. 



Trabajar



El equipo del proyecto estaba formado por 15 personas. El equipo estaba formado por diez instaladores, un ingeniero jefe, así como sus suplentes en diversas áreas (automatización, eléctrica, etc.). 



El trabajo comenzó en abril de 2020 con miras a finalizar en junio. Sin embargo, no fue tan fácil seguir el plan: la tarea se complicó por la pandemia COVID-19, por lo que uno de los proveedores no pudo entregar los interruptores necesarios para el equipo de panel desde Europa a tiempo. 



En este momento, ya se han completado todos los estudios de prediseño y se ha preparado la documentación de diseño, se han comprado el SAI necesario y la mayoría de los materiales. Era imposible esperar a que la situación volviera a la normalidad: las capacidades renovadas del servidor debían ponerse en funcionamiento dentro de un plazo predeterminado según los términos del contrato con el nuevo cliente del centro de datos. 



Por lo tanto, se decidió proceder con la instalación en el sitio para cumplir con las etapas de trabajo planificadas.









Arreglo de baterías UPS en el centro de datos Linxdatacenter



Vencer a COVID-19: flexibilidad de planificación, equipos y el factor GUI



En primer lugar, confiamos en el trabajo bien coordinado del equipo, especialmente en el equipo de "capataces-ensambladores". Me gustaría señalar la contribución del contratista: los especialistas de Tempesto pudieron brindar la mayor flexibilidad de interacción con nosotros y entre ellos en condiciones difíciles.



Por ejemplo, cuando era necesario cambiar la energía de una fuente de electricidad a otra, los clientes estaban lejos de estar siempre listos para este procedimiento, a pesar de las notificaciones. A menudo no permitían que sus equipos se apagaran porque no tenían tiempo para prepararse adecuadamente: no hicieron una copia de seguridad, no transfirieron los sistemas a un sitio de copia de seguridad, etc. 



A pesar de esto, el tiempo de inactividad se evitó casi por completo. El “Plan B” siempre estuvo listo para tales casos, con qué mantener ocupados a los instaladores dentro de las tareas actuales. 



Con el fin de completar el proyecto a tiempo, se trabajó a diario, sin interrupciones los fines de semana. Los empleados tuvieron que trabajar en condiciones bastante inusuales: con el uso constante de EPP y manteniendo la distancia debido a la pandemia. 









Panel de distribución de energía en el centro de datos Linxdatacenter



La gestión competente del tiempo del equipo y una clara comprensión de la arquitectura de la solución futura ayudaron a evitar pérdidas de tiempo significativas, y la instalación de cableado, equipos de panel y UPS se completó a tiempo.



El estatus de distribuidor oficial del contratista para los productos del proveedor también ayudó. Cuando resultó que uno de los UPS se dañó después de desembalar, gracias al contacto directo con el proveedor, el reemplazo llegó en 1 semana. Si el proveedor del equipo fuera uno y el instalador fuera otro, solo en este problema perderíamos 2-4 semanas. 



resultados



Como resultado de la actualización, que incluyó 4 UPS adicionales de la serie Delta DHP 500kVA, la energía se redistribuyó parcialmente a nuevos equipos, y la carga máxima por unidad UPS finalmente se redujo del 49% al 43%.



En general, la tolerancia a fallas del centro de datos ya era satisfactoria, pero la actualización la mejoró. Anteriormente, si la carga de un SAI excedía el 50% del máximo, en caso de emergencia, el apagado sería inevitable. Por ejemplo, cuando un conjunto de condensadores se estrella en un SAI monobloque, todos los sistemas conectados a él caen. En un SAI modular, solo un módulo fallará y el resto de los elementos seguirán funcionando. 



Lo más importante: conclusiones



Los miembros del equipo del proyecto han adquirido una importante experiencia en el manejo de tareas complejas frente a crisis imprevistas. 



¿A qué conclusiones hemos llegado?



  • Los problemas de suministro pueden ocurrir incluso en condiciones normales. En el contexto de una pandemia y otras circunstancias de fuerza mayor, es necesario prepararse para los escenarios más negativos para el desarrollo de eventos: los tiempos de entrega pueden verse interrumpidos con mayor frecuencia y por períodos más largos;
  • El trabajo debe llevarse a cabo de acuerdo con el plan de programación, en el que los riesgos se calculan de antemano. Se debe prestar especial atención a los puntos nodales en los que se cruzan las etapas;
  • En caso de incumplimiento del plazo de entrega, es necesario realizar el trabajo que se puede realizar independientemente de la interrupción. Si suspende todo el trabajo en el proyecto hasta que se reciban todos los componentes, el trabajo corre el riesgo de retrasarse o convertirse en un "asalto";
  • – ,   . . 



All Articles