Huawei CloudFabric 2.0: cómo deberían verse las soluciones de redes de centros de datos en la banca digital inteligente

En la Huawei FSI Week 2020 celebrada en línea, el director de tecnología de la línea de productos de transferencia de datos de Huawei, Daniel Tang, habló en un lenguaje accesible sobre los últimos avances de la compañía en soluciones de red para centros de datos que permiten la transformación de un centro de datos de "solo una nube" a verdaderamente inteligente. Y al mismo tiempo hizo una pequeña excursión al trasfondo de esta transformación.







Qué ha cambiado en la banca de consumo



En China, hace unos cinco años, obtener un préstamo no era un negocio rápido, para un simple mortal, seguro. Se requería llenar una gran cantidad de papeles, enviarlos o llevarlos a una sucursal bancaria, tal vez incluso haciendo cola, y de regreso a casa, para esperar una decisión. Cuanto esperar Y cómo sale, de una semana a varios meses.



Para 2020, este procedimiento se ha simplificado drásticamente. Recientemente realicé un pequeño experimento: intenté obtener un préstamo utilizando la aplicación móvil de mi banco. Varios toques en la pantalla del teléfono inteligente, y el sistema promete darme una respuesta en un cuarto de hora a más tardar. Pero en menos de cinco minutos, recibo una notificación automática que indica el tamaño del préstamo con el que puedo contar. De acuerdo, un avance impresionante en comparación con la situación de hace cinco años. Curiosamente, tomó días y semanas enteros en el pasado reciente.







Entonces, antes, la mayor parte del tiempo se dedicaba a la verificación de datos y la puntuación manual. Toda la información de los cuestionarios y otros documentos tuvo que ingresarse en el sistema de TI del banco. Pero esto fue solo el comienzo de la terrible experiencia: los empleados del banco verificaron personalmente su historial crediticio, después de lo cual tomaron la decisión final. Salían de la oficina a las 17:00 o 18:00, descansaban los fines de semana y el proceso, como resultado, podía prolongarse por mucho tiempo.



Las cosas son diferentes en estos días. El factor humano en muchas tareas de la banca digital generalmente se saca de entre paréntesis. La evaluación, incluidas las comprobaciones antifraude y AML, se realiza automáticamente mediante algoritmos inteligentes. Los coches no necesitan descanso, por lo que funcionan los siete días de la semana y las 24 horas. Además, una buena cantidad de información necesaria para la toma de decisiones ya está almacenada en bases de datos bancarias. Esto significa que el veredicto se dicta en un período mucho más breve que en "la antigüedad".



En general, antes el centro de datos bancarios se utilizaba más bien para resolver problemas del tipo "registro". Durante mucho tiempo fue solo un centro contable y no produjo nada por sí mismo. Hoy en día, hay cada vez más centros de datos "inteligentes" donde se crea un producto.... Se utilizan para cálculos complejos y ayudan a derivar inteligencia a partir de datos brutos; de hecho, conocimientos con un alto valor agregado. Además, la minería de datos continua, si se prepara correctamente, por supuesto, aumenta aún más la eficiencia de los procesos.







Estas transformaciones se están produciendo no solo en las finanzas, sino en prácticamente todas las verticales comerciales. Para empresas de una amplia variedad de perfiles (y para nosotros, como fabricante de soluciones), los centros de datos son ahora el principal soporte en el mundo, donde la competencia entre desarrollos inteligentes es más intensa que nunca. Incluso hace cinco años, era corriente argumentar en línea con el hecho de que el centro de datos está inscrito en el mundo de las tecnologías en la nube, y esto implicaba la capacidad de escalar de manera flexible el conjunto distribuido total de recursos para la informática y el almacenamiento de datos. Pero esta es la era de las soluciones inteligentes, y en el centro de datos podemos realizar minería de datos de forma continua, convirtiendo los resultados obtenidos en extraordinarias ganancias de rendimiento. En el sector financiero, estos cambios están llevando, entre muchos otros resultados, al hecho de queque la evaluación de las solicitudes de préstamos se está acelerando radicalmente. O, por ejemplo, permiten recomendar instantáneamente los productos financieros más adecuados para un cliente bancario en particular.



En el sector público, en las telecomunicaciones, en la industria energética, el trabajo inteligente con datos contribuye hoy a la transformación digital con un aumento espectacular de la productividad de la organización. Naturalmente, nuevas circunstancias formarán una nueva demanda, y no solo en relación con los recursos informáticos y los sistemas de almacenamiento de datos, sino también en relación con las soluciones de red para los centros de datos.



¿Qué debería ser un "centro de datos inteligente"?









En Huawei, hemos identificado tres desafíos principales del centro de datos en la era del centro de datos inteligente.



Primero, se requiere un ancho de banda extraordinario para manejar los flujos interminables de nuevos datos.... Según nuestras observaciones, durante los últimos cinco años, el volumen de datos almacenados en los centros de datos se ha multiplicado por diez. Pero lo que es aún más impresionante es la cantidad de tráfico que se genera al acceder a esos datos. En los centros de datos de "tipo de registro", toda esta información se utilizó para resolver problemas de contabilidad y, a menudo, suponía un peso muerto, y en los centros de datos de un nuevo tipo "funciona": necesitamos proporcionar minería de datos constante. Como resultado, se realizan entre 10 y 1000 veces más iteraciones al acceder a una unidad de datos almacenados que antes. Por ejemplo, al entrenar modelos de IA, las tareas computacionales se realizan casi sin parar en segundo plano, con el funcionamiento constante de algoritmos de redes neuronales para aumentar la "inteligencia" del sistema. Así, no solo están creciendo los volúmenes de datos almacenados, sino también el tráfico que se genera al acceder a ellos.Por lo tanto, no es en absoluto un capricho de los proveedores de telecomunicaciones que cada vez haya más de ciento doscientos puertos gigabit en nuevos modelos de servidores de almacén de datos.



En segundo lugar, sin pérdida de paquetes de datosen 2020, la obligación absoluta. En cualquier caso, desde nuestro punto de vista. Anteriormente, tales pérdidas no eran un dolor de cabeza para los ingenieros de los centros de datos bancarios. Los cuellos de botella fueron la potencia de procesamiento y la eficiencia del almacenamiento. Pero los valores promedio de la industria de ambos indicadores han aumentado significativamente durante los últimos cinco años a escala global. Naturalmente, la eficiencia de la infraestructura de red resultó ser el cuello de botella en el trabajo de los centros de datos. Trabajando con uno de nuestros principales clientes, descubrimos que cada porcentaje agregado a la tasa de pérdida de paquetes amenaza con reducir a la mitad la eficiencia del entrenamiento de los modelos de IA. De ahí el enorme impacto en la productividad y eficiencia del uso de recursos informáticos y sistemas de almacenamiento de datos. Eso es lo que hay que superarpara respaldar la transformación de un centro de datos simple en un centro de datos para la era inteligente.



En tercer lugar, es importante brindar el servicio sin problemas y sin problemas . La banca digital moderna ha enseñado, y ha enseñado con bastante razón, a las personas sobre el hecho de que los servicios de las instituciones financieras pueden, o más bien, deben estar disponibles las 24 horas del día, los 7 días de la semana. Una situación común: un empresario agotado con una rutina diaria desordenada, con una gran necesidad de fondos adicionales, se despierta cerca de la medianoche y quiere saber en qué línea de crédito puede contar. Los caminos de regreso están cortados: el banco ya no tiene la oportunidad de suspender el trabajo del CD para arreglar o actualizar algo.



Nuestra solución CloudFabric 2.0 está diseñada con precisión para hacer frente a estos desafíos. Admite el mayor rendimiento, la gestión inteligente de la red del centro de datos y el funcionamiento impecable de las redes de conducción autónoma (ADN).



Contenido de CloudFabric 2.0 para centros de datos inteligentes









Con respecto al alto rendimiento, confiamos no solo en la escalabilidad de nuestras soluciones de red, sino también en la flexibilidad para trabajar con ellas. Por ejemplo, los switches de centro de datos de Huawei de la línea CloudEngine se convirtieron en los primeros dispositivos de esta clase en la industria con un procesador integrado para computación de redes neuronales en tiempo real, ayudando, entre otras cosas, a resolver problemas dentro de la infraestructura de red y evitar la pérdida de paquetes de datos (esto se logra utilizando el algoritmo iLossless, en incluido para el escenario iNOF RoCE). Pero, por supuesto, el ancho de banda real también importa. Incluir soporte para interfaces de 400 Gb / s es importante, así como la compatibilidad con versiones anteriores de las conexiones de diez, cuarenta y cien gigabits actualmente extendidas.



Los nodos de soporte de la infraestructura también deberían poder trabajar con alta densidad de conexiones (los llamados escenarios de alta densidad), con la posibilidad de una escalabilidad significativa de la solución. Nuestro modelo insignia de centro de datos CloudEngine 16800 admite hasta 48 puertos a 400 Gbps por ranura, tres veces más que su competidor más cercano.



En cuanto al sistema en su conjunto, las posibilidades de ampliar la escalabilidad del rendimiento por chasis también son impresionantes: 768 puertos de 400 Gb / s por chasis , o seis veces más de lo que permiten las soluciones de otros actores del mercado. Esto nos da una razón para llamar al CloudEngine 16800 el conmutador de centro de datos más poderoso en la era de la IA ganadora.







El componente intelectual de la solución de red también pasa a primer plano. En particular, también es necesario para garantizar un nivel cero de pérdida de paquetes de datos. Para lograr este resultado, utilizamos nuestros avances tecnológicos más avanzados, incluido un procesador de inteligencia artificial integrado para la computación en "redes neuronales", así como el algoritmo iLossless mencionado anteriormente. Al realizar proyectos para nuestros principales clientes, estábamos convencidos de que estas soluciones pueden aumentar significativamente el rendimiento del sistema en al menos dos escenarios comunes.



El primero es entrenar modelos de IA. Requiere acceso constante a datos y cálculos en matrices enormes u operaciones "pesadas" con TensorFlow. Nuestro iLossless es capaz de aumentar la productividad del entrenamiento de modelos de IA en un 27%, comprobado en casos reales y verificado por la prueba de laboratorio de Tolly Group. El segundo escenario es mejorar la eficiencia de los sistemas de almacenamiento. Su, a su vez, el uso de nuestros desarrollos puede aumentarlo en aproximadamente un 30%.



Entre otras cosas, junto con nuestros clientes, nos esforzamos por probar las nuevas oportunidades que abren nuestros desarrollos. Confiamos en que al mejorar la estructura de conmutación basada en Ethernet para el centro de datos, podemos transformar la estructura del centro de datos de alto rendimiento con la red de almacenamiento en una única infraestructura coherente basada en Ethernet. Por lo tanto, no solo para aumentar la productividad de los procesos de aprendizaje para los modelos de IA y mejorar el acceso a los almacenes de datos definidos por software, sino también para optimizar significativamente el costo total de propiedad de un centro de datos a través de la integración mutua y la fusión de redes verticales que son independientes en los niveles físicos.







Muchos de nuestros clientes disfrutan desplegando estas nuevas funciones. Y uno de esos clientes es la propia Huawei. En concreto, que forma parte de nuestro grupo de empresas Huawei Cloud. Trabajando en estrecha colaboración con nuestros colegas de esta división, nos aseguramos de que, al garantizarles que no se perderían paquetes de datos, dimos el impulso para mejorar notablemente sus procesos comerciales. Finalmente, entre nuestros logros "internos", destacamos el hecho de que en Atlas 900, el clúster de inteligencia artificial más grande del mundo, podemos proporcionar potencia informática utilizada para entrenar inteligencia artificial a un nivel superior a los 1000 petaflops, la cifra más alta en una computadora. industria hoy.



Otro escenario de gran relevancia es el almacenamiento de datos en la nube mediante sistemas All-Flash. Este es un servicio muy "tendencia" según los estándares de la industria. El aumento de los recursos informáticos y la expansión de las instalaciones de almacenamiento requieren naturalmente tecnologías avanzadas del campo de las soluciones de redes de centros de datos. Por eso, continuamos trabajando con Huawei Cloud e implementando cada vez más escenarios de aplicaciones utilizando nuestras soluciones de red.



Qué puede hacer ADN Networks hoy









Pasemos a las redes autónomas (ADN). No hay duda de que las redes definidas por software (redes definidas por software) desde el punto de vista de la tecnología - un paso adelante seguro en la gestión del componente de red del centro de datos. La implementación aplicada del concepto SDN acelera significativamente la inicialización y configuración de la capa de red del centro de datos. Pero, por supuesto, las capacidades que proporciona no son suficientes para automatizar completamente la operación y mantenimiento del centro de datos. Para ir más allá, hay tres desafíos principales que deben abordarse.



En primer lugar, en la infraestructura de red de los centros de datos hay cada vez más oportunidades asociadas a la prestación de servicios y entornos para su funcionamiento, especialmente en el sector financiero. Es importante poder traducir automáticamente la intención del nivel de servicio a la capa de red....



En segundo lugar, también se trata de verificar dichos comandos de aprovisionamiento incremental. Es comprensible que las redes de los centros de datos se hayan configurado hace mucho tiempo, basándose en enfoques bien establecidos o incluso obsoletos. ¿Cómo se asegura de que la personalización adicional no interrumpa sus procedimientos depurados? La verificación automática de nuevos ajustes adicionales es indispensable. Precisamente automático, ya que el conjunto de configuraciones existentes en el centro de datos suele ser prohibitivamente grande. Es prácticamente imposible lidiar con él manualmente.



En tercer lugar, surge la cuestión de la eliminación rápida y eficaz de los problemas en la infraestructura de la red.... Cuando la automatización alcanza un alto nivel, los administradores e ingenieros de servicio del centro de datos ya no pueden rastrear en tiempo real lo que está sucediendo en la red. Necesitan un conjunto de herramientas que pueda hacer que una red de miles de cambios diarios sea transparente para ellos, así como construir bases de datos basadas en gráficos de conocimiento para tratar rápidamente los problemas.



Los ADN pueden ayudarnos a enfrentar estos desafíos de pasar a centros de datos verdaderamente inteligentes. Y la ideología de las redes con control autónomo (migró al mundo de los centros de datos de la industria vecina, en la unión de IoT y V2X, en particular) nos permite revisar los enfoques de automatización en diferentes niveles de la red del centro de datos.







De momento, en la autonomía de gestión de redes para centros de datos, hemos alcanzadonivel L3 (automatización condicional). Esto significa un alto grado de automatización del centro de datos, en el que se requiere la intervención humana puntualmente y solo en determinadas condiciones.



Mientras tanto, en varios escenarios, también es posible la automatización completa. Ya estamos trabajando con nuestros clientes como parte de un programa de innovación conjunto para la automatización integral de redes de centros de datos de acuerdo con el concepto ADN, principalmente en el contexto de resolución de problemas de red, y en relación con los más urgentes y que requieren más tiempo, hemos logrado el éxito: por ejemplo, con la ayuda de nuestro Las tecnologías inteligentes logran cerrar automáticamente alrededor del 85% de los escenarios de falla que se desarrollan con mayor frecuencia en las redes de centros de datos .



Esta funcionalidad se implementa en el marco de nuestro concepto O&M 1-3-5: un minuto para establecer que ha ocurrido una falla o para identificar el riesgo de una falla, tres minutos para determinar su causa raíz y cinco minutos para sugerir cómo eliminarlo. Por supuesto, por el momento, la participación humana es necesaria para tomar decisiones finales, en particular, elegir una de las posibles decisiones y dar el mando para ejecutarla. Alguien tiene que asumir la responsabilidad de la elección. Sin embargo, con base en la práctica, creemos que el sistema, incluso en su implementación actual, ofrece soluciones altamente calificadas y adecuadas.



Estos son algunos de los desafíos más desafiantes que enfrentan los arquitectos de centros de datos inteligentes en 2020, y realmente los hemos abordado. Por ejemplo, la funcionalidad para transferir solicitudes de la capa de servicio a la capa de red y para la verificación automática de la configuración ya está incluida en CloudFabric 2.0.







Nos complace que nuestros logros hayan sido reconocidos, y este año recibimos el premio Gartner Peer Insights Customer Choice Award, así como el premio F&S Global Data Center Switch Technology Leadership Award, por el conmutador CloudEngine 16800, que fue reconocido por un rendimiento excepcional. , la mayor densidad de interfaces de 400 gigabits y la escalabilidad general del sistema, así como las tecnologías inteligentes que permiten, en particular, reducir el nivel de pérdida de paquetes de datos a cero.



All Articles