Novedades de la línea de enrutadores de alto rendimiento de NetEngine

Es hora de revelar detalles sobre los nuevos enrutadores de clase de operador NetEngine 8000 de Huawei, sobre la base de hardware y las soluciones de software que permiten construir conexiones de extremo a extremo con un rendimiento de 400 Gbps y monitorear la calidad de los servicios de red en un nivel de subsegundos.











Qué determina qué tecnologías se necesitan para las soluciones de red



Los requisitos para los equipos de red más recientes ahora están impulsados ​​por cuatro tendencias fundamentales:



  • la proliferación de la banda ancha móvil 5G;
  • el crecimiento de las cargas en la nube en centros de datos públicos y privados;
  • la expansión del mundo de IoT;
  • creciente demanda de inteligencia artificial.




Durante la pandemia surgió otra tendencia generalizada: los escenarios con una presencia física reducida tanto como sea posible a favor de una virtual son cada vez más atractivos. Estos incluyen, entre otros, servicios y soluciones de realidad virtual y aumentada basados ​​en redes Wi-Fi 6. Todas estas aplicaciones requieren un canal de alta calidad. NetEngine 8000 está destinado a proporcionarlo.







Familia NetEngine 8000



Los dispositivos de la familia NetEngine 8000 se dividen en tres series principales. Marcados con la letra X se encuentran los modelos insignia de alto rendimiento para operadores de telecomunicaciones o para centros de datos de alta carga. La serie M está diseñada para la implementación de varios escenarios de metro. Y los dispositivos con índice F están destinados principalmente a la implementación de escenarios DCI comunes (interconexión de centro de datos). La mayoría de los modelos 8K pueden formar parte de túneles de extremo a extremo con un ancho de banda de 400 Gbps y mantener un nivel de servicio garantizado (Acuerdo de nivel de servicio - SLA).







Hecho: en la actualidad, solo Huawei fabrica una gama completa de equipos para organizar redes de clase 400GE. La ilustración de arriba muestra un escenario para construir una red para un cliente de gran empresa o un gran operador. En este último caso, se utilizan los enrutadores de núcleo NetEngine 9000 de alto rendimiento, así como los nuevos enrutadores NetEngine 8000 F2A capaces de agregar un gran número de conexiones de 100, 200 o 400 Gbps.



Las fábricas de Metro se basan en dispositivos de la serie M. Estas soluciones permiten adaptarse al crecimiento de diez veces en el volumen de tráfico, que se espera para la próxima década, sin cambiar la plataforma.







Huawei fabrica de forma independiente módulos ópticos con un ancho de banda de 400 Gbps. Las soluciones construidas sobre ellos son un 10-15% más baratas que otras similares en capacidad, pero utilizan canales de 100 gigabits. Las pruebas de módulos comenzaron en 2017, y ya en 2019, tuvo lugar la primera implementación de equipos basados ​​en ellos; El operador africano de telecomunicaciones Safaricom está comercializando actualmente dicho sistema.







El enorme ancho de banda del NetEngine 8000, que puede parecer excesivo en 2020, definitivamente será necesario en un futuro no muy lejano. Además, el enrutador es adecuado para su uso como un gran punto de intercambio, lo que sin duda será útil tanto para operadores de segundo nivel como para grandes estructuras empresariales en la fase de rápido crecimiento y creadores de soluciones de gobierno electrónico.







Huawei también promueve la proliferación de una serie de nuevas tecnologías, incluido el protocolo de enrutamiento SRv6, que simplifica enormemente la entrega del tráfico VPN del operador. La tecnología FlexE (Ethernet flexible) proporciona un ancho de banda garantizado en el segundo nivel del modelo OSI, e iFIT (Telemetría de información de flujo in situ) le permite realizar un seguimiento preciso de los parámetros de cumplimiento de las condiciones de SLA.







Desde el punto de vista de un proveedor, SRv6 se puede aplicar desde la capa de contenedor en un centro de datos construido sobre NFV (virtualización de funciones de red) a, por ejemplo, un entorno de banda ancha inalámbrica. Los clientes corporativos necesitarán el uso de un extremo a otro del nuevo protocolo al construir redes troncales (backbone). La tecnología, enfatizamos, no es propietaria y es utilizada por diferentes proveedores, lo que elimina los riesgos de incompatibilidad.







Así es como se ve el cronograma para comercializar la tecnología SRv6 para admitir soluciones 5G. Caso práctico: la empresa árabe Zain Group, en proceso de transición al uso de 5G, modernizó su red, incrementó la capacidad de los canales backbone, y también mejoró la manejabilidad de la infraestructura al introducir SRv6.







Cómo aplicar estas tecnologías



Anteriormente se han utilizado tres productos diferentes como el "paraguas tecnológico" que cubre las soluciones anteriores. U2000 se utilizó como NMS para el dominio de transmisión y el dominio de IP. Además, los sistemas SDN utilizaron sistemas uTraffic y el mucho más famoso Agile Controller. Sin embargo, esta combinación resultó no ser muy conveniente para los enrutadores de nivel de operador, por lo que ahora estos productos se combinan en la herramienta CloudSoP .







En primer lugar, le permite administrar completamente el ciclo de vida de la infraestructura, comenzando con la construcción de una red, óptica o IP. También es responsable de la gestión de recursos, tanto estándar (MPLS) como nuevos (SRv6). Finalmente, CloudSoP hace posible brindar un servicio completo a todos los servicios con un alto nivel de granularidad.







Echemos un vistazo más de cerca al enfoque de gestión clásico. En este caso, se puede hacer usando L3VPN o SR-TE, lo que brinda opciones adicionales para crear túneles. Para asignar recursos para diversas tareas de servicio, se utilizan más de un centenar de parámetros y enrutamiento de segmentos.







¿Cómo es la implementación de un servicio de este tipo? Primero, debe configurar la política principal para un nivel específico (plano). En el diagrama anterior se ha seleccionado la tecnología SRv6, con la ayuda de la cual se configura la entrega de tráfico desde el punto A al punto E. El sistema calculará las posibles rutas teniendo en cuenta el ancho de banda y los retrasos, y también creará parámetros para su posterior control.







Después de la configuración, comenzamos a crear y lanzar servicios VPN adicionales. Una gran ventaja de la solución de Huawei es que, a diferencia de la ingeniería de tráfico MPLS estándar, le permite sincronizar rutas de túneles sin complementos adicionales.







El diagrama anterior muestra el proceso general de captura de información. SNMP se utiliza a menudo para ello, lo que lleva mucho tiempo y da un resultado medio. Sin embargo, la telemetría, que usamos anteriormente en centros de datos y soluciones de campus, ha llegado al mundo de las redes de operadores. Agrega una carga, pero le permite comprender lo que está sucediendo en la red, no al minuto, sino al nivel inferior al segundo.







Por supuesto, el volumen de tráfico recibido debe ser "digerido" de alguna manera. Para ello, se utiliza tecnología adicional de aprendizaje automático. Basado en patrones precargados de las fallas de red más comunes, el sistema de monitoreo puede predecir la probabilidad de excesos. Por ejemplo, una avería de un módulo SFP (factor de forma pequeño conectable) o una ráfaga repentina de tráfico en la red.







Y así es como se ve un sistema de control de escalamiento horizontal basado en los servidores ARM TaiShan y la base de datos GaussDB. Los nodos individuales del sistema analítico tienen el concepto de "roles", lo que le permite expandir de forma granular los servicios de diagnóstico con un aumento en el tráfico o un aumento en la cantidad de nodos de red.

En otras palabras, todo lo que era bueno en el mundo del almacenamiento está llegando gradualmente al área de administración de redes.




Un ejemplo sorprendente de la introducción de nuestras nuevas tecnologías es el Banco Industrial y Comercial de China (ICBC). Ha implementado una red troncal de enrutadores de alto rendimiento a los que se les asignan roles específicos. Según la NDA, solo podemos dar una idea general de la estructura de la red en el diagrama. Incluye tres grandes centros de datos conectados por túneles de un extremo a otro y 35 sitios adicionales (centros de datos de segundo nivel). Se utilizan tanto conexiones estándar como SR-TE.







Arquitectura inteligente IP WAN de 3 capas



Las soluciones de Huawei se basan en una arquitectura de tres capas, en el nivel inferior del cual hay equipos de diferente rendimiento. En el segundo nivel, hay un entorno de gestión de equipos y servicios adicionales que amplían la funcionalidad de análisis y control de la red. Se aplica la capa superior, relativamente hablando. Los escenarios de aplicación más comunes involucran la organización de las redes de operadores de telecomunicaciones, instituciones financieras, empresas de energía y agencias gubernamentales.



Aquí hay un breve video que describe las capacidades del NetEngine 8000 y las soluciones técnicas utilizadas en él:





Por supuesto, el equipo debe diseñarse para adaptarse al crecimiento del tráfico y la expansión de la infraestructura, teniendo en cuenta el suministro de energía y la refrigeración adecuados. Cuando el modelo de enrutador insignia está equipado con 20 PSU de 3 kW cada una, el uso de nanotubos de carbono en el sistema de eliminación de calor ya no parece redundante.







¿Para qué es todo esto? Parece una fantasía, pero ahora para nosotros 14,4 Tbit / s por ranura es bastante alcanzable. Y este ancho de banda alucinante está en demanda. En particular, las mismas compañías financieras y energéticas, muchas de las cuales hoy tienen redes troncales creadas utilizando tecnología DWDM (multiplexación por división de longitud de onda densa). Con el tiempo, también está creciendo el número de aplicaciones que requieren velocidades cada vez mayores.



Uno de nuestros escenarios para construir redes de aprendizaje automático entre dos clústeres Atlas 900 también requiere un ancho de banda de clase terabit. Y hay muchas tareas similares. Estos incluyen, en particular, computación nuclear, cálculos meteorológicos, etc.











Base de hardware y sus requisitos



Los diagramas muestran los módulos de enrutador LPUI disponibles actualmente con tarjetas integradas y sus características.







Y así es como se ve la hoja de ruta con nuevas opciones de módulos que estarán disponibles durante los próximos dos años. Al desarrollar soluciones basadas en ellos, es importante considerar el consumo de energía. Ahora los centros de datos estándar se construyen a una velocidad de 7-10 kW por rack, mientras que el uso de enrutadores de clase terabit implica un consumo de energía varias veces mayor (hasta 30-40 kW en el pico). Esto implica la necesidad de diseñar un sitio especializado o crear una zona separada de alta carga en el centro de datos existente.







Una mirada general al chasis revela que las fábricas están ocultas detrás del ensamblaje del ventilador central. Existe la posibilidad de su sustitución "en caliente", realizada gracias a la redundancia según el esquema 2N o N + 1. En esencia, se trata de una arquitectura ortogonal estándar de alta fiabilidad.







No solo buques insignia



No importa cuán impresionantes sean los modelos insignia, la mayoría de las instalaciones se realizan en soluciones de caja de las series M y F.



Los enrutadores de servicio más populares ahora son los modelos M8 y M14. Permiten trabajar con interfaces de baja velocidad, como E1, y de alta velocidad (100 Gb / s ahora y 400 Gb / s en un futuro próximo) dentro de una plataforma.







El rendimiento del M14 es suficiente para satisfacer todas las necesidades de los clientes empresariales comunes. Se puede utilizar para crear soluciones L3VPN estándar para la comunicación con proveedores, también es una buena herramienta adicional, por ejemplo, para recopilar telemetría o utilizar SRv6.







Hay una gran cantidad de tarjetas disponibles para el modelo. No hay fábricas separadas y se utilizan supervisores para garantizar la conectividad. De esta forma, se logra la distribución de rendimiento por puertos indicada en el diagrama.







En el futuro, el supervisor puede ser reemplazado por uno nuevo, lo que dará un nuevo rendimiento en los mismos puertos.







El M8 es ligeramente más pequeño que el M14 y también es inferior en rendimiento al modelo anterior, pero sus casos de uso son muy similares.







Un conjunto de tarjetas físicas compatibles con M8 permite, por ejemplo, configurar una conexión a dispositivos P a través de una interfaz de 100 Gbps, utilizar la tecnología FlexE y cifrar todo esto.







En términos generales, es con el M6 que puede comenzar a trabajar con su entorno de operador. Es pequeño y no apto para proveedores, pero se puede aplicar fácilmente como punto de agregación de tráfico para conectar centros de datos regionales, por ejemplo, en un banco. Además, el conjunto de software aquí es el mismo que en los modelos anteriores.







Las tarjetas disponibles para el M6 son más pequeñas y el rendimiento máximo es de 50 Gb / s, que, sin embargo, es notablemente más alto que las soluciones estándar de 40 Gb / s en la industria.







El modelo más joven, el M1A, merece una mención aparte. Esta es una pequeña solución, que puede resultar útil cuando se espera un rango de temperatura de funcionamiento extendido (-40 ... + 65 ° ).








Algunas palabras sobre la línea F. El modelo NetEngine 8000 F1A se convirtió en uno de los productos Huawei más populares en 2019, sobre todo por el hecho de que está equipado con puertos con ancho de banda de 1 a 100 Gbps (hasta 1,2 Tbps en total ).







Más acerca de SRv6



¿Por qué exactamente ahora necesitamos incluir soporte para la tecnología SRv6 en nuestros productos?



Actualmente, el número de protocolos necesarios para organizar túneles VPN puede ser de más de 10, lo que provoca serios problemas de gestión y sugiere la necesidad de simplificar radicalmente el proceso.







La respuesta de la industria a este desafío fue la creación de la tecnología SRv6, en cuya aparición participaron Huawei y Cisco.







Una de las limitaciones que debían eliminarse era la necesidad de utilizar el comportamiento por salto (PHB) para enrutar paquetes estándar. Es bastante difícil establecer una interacción "entre operadores" a través de Inter-AS MP-BGP con servicios adicionales (VPNv4), por lo que existen muy pocas soluciones de este tipo. SRv6 le permite enrutar inicialmente un paquete a través de todo el segmento sin escribir túneles especiales. Y la programación de los procesos en sí se simplifica, lo que facilita mucho las grandes implementaciones.







El diagrama muestra un caso para implementar SRv6. Las dos WAN se han vinculado mediante varios protocolos diferentes. Para recibir servicio desde cualquier servidor virtual o de hardware, se requirió una gran cantidad de traspasos entre VXLAN, VLAN, L3VPN, etc.

Después de la implementación de SRv6, el operador tenía un túnel de extremo a extremo, ni siquiera al servidor de hardware, sino al contenedor de Docker.




Más información sobre la tecnología FlexE



El segundo nivel del modelo OSI es malo porque no proporciona los servicios necesarios y el nivel de SLA que necesitan los proveedores. A ellos, a su vez, les gustaría obtener algo analógico de TDM (multiplexación por división de tiempo), pero en Ethernet. Se han utilizado muchos enfoques para resolver el problema, con resultados muy limitados.







Flex Ethernet sirve precisamente para garantizar la calidad de la capa SDH (Synchronous Digital Hierarchy) y TDM en redes IP. Esto fue posible gracias al trabajo con el plano de reenvío, cuando modificamos el entorno L2 de esta manera para que sea lo más eficiente posible.







¿Cómo funciona cualquier puerto físico estándar? Hay un cierto número de colas y un anillo tx. Un paquete en el búfer está esperando su procesamiento, lo que no siempre es conveniente, especialmente si hay flujos de elefantes y ratones.



Inserciones adicionales y otra capa de abstracción ayudan a proporcionar un ancho de banda garantizado al nivel del entorno físico.







Se asigna una capa MAC adicional al nivel de transferencia de información, lo que le permite crear colas físicas a las que se les pueden asignar SLA específicos.







Así es como se ve en el nivel de implementación. La capa adicional realmente implementa el entramado TDM. Con esta metainserción, es posible poner en cola y dar forma a los servicios TDM a través de Ethernet.







Uno de los casos de uso de FlexE implica un cumplimiento muy estricto del SLA mediante la creación de espacios de tiempo para igualar el ancho de banda o proporcionar recursos para servicios críticos.







Otro escenario te permite trabajar con defectos. En lugar de simplemente hacer hash en la transmisión de información, formamos canales separados prácticamente a nivel físico, en contraste con los virtuales creados por QoS (Quality of Service).







Más información sobre iFIT



Al igual que FlexE, iFIT es una tecnología con licencia de Huawei. Permite revisiones de SLA muy detalladas. A diferencia de los mecanismos estándar IP SLA y NQA, iFIT no opera con tráfico sintético, sino con tráfico "en vivo".







IFIT está disponible en todos los dispositivos que admiten telemetría. Para ello, se utiliza un campo adicional que no está ocupado por los datos de opción estándar. Allí se registra información que le permite comprender lo que está sucediendo en el canal.



***



Resumiendo lo dicho, destacamos que la funcionalidad de NetEngine 8000 y las tecnologías incorporadas en el "ocho milésimo" hacen de estos dispositivos una opción razonable y justificada a la hora de crear y desarrollar redes carrier class, redes troncales de empresas energéticas y financieras, así como sistemas del nivel de "gobierno electrónico"



All Articles