✋🏿 🌯 👩 Huawei DCN: cinco escenarios para construir una red de centro de datos 💆🏿 😏 🌬️

Hoy, nuestro enfoque no es solo en la línea de productos de red del centro de datos de Huawei, sino también en cómo construir soluciones avanzadas de punta a punta basadas en ellos. Comencemos con los escenarios, pasemos a las funciones específicas compatibles con el equipo y terminemos con una descripción general de dispositivos específicos que pueden formar la base de centros de datos modernos con el más alto nivel de automatización de los procesos de red.

No importa cuán impresionantes sean las características de los equipos de red, las capacidades de las soluciones arquitectónicas aplicadas basadas en ellas están determinadas por cuán efectiva puede ser la integración mutua de hardware, software, tecnologías virtuales y otras tecnologías asociadas. Tratando de mantenernos al día, intentamos ofrecer a nuestros clientes oportunidades modernas y prometedoras, que a menudo superan las ideas más atrevidas de otros proveedores.

Las soluciones de Cloud Fabric incluyen una red de centro de datos, un controlador SDN y otros componentes necesarios para un proyecto específico, incluidos los de otros fabricantes.

El primer y más simple escenario implica el uso de un número mínimo de componentes: la red está construida con hardware de Huawei y herramientas de terceros para automatizar la gestión de la red y los procesos de monitoreo. Por ejemplo, como Ansible o Microsoft Azure.

El segundo escenario supone que el cliente ya está utilizando la virtualización y SDN para los centros de datos, por ejemplo, NSX, y quiere usar el equipo de Huawei como un VTEP de hardware (Punto final del túnel de Vitual) dentro de la solución VMware existente. El sitio web de esta empresa contiene una lista deEquipo de Huawei que ha sido probado y puede usarse como VTEP. Después de todo, no es un secreto para nadie que, no importa cuán exitosas sean las soluciones de software VXLAN (LAN virtual extensible) en los conmutadores virtuales, las implementaciones de hardware son más eficientes en términos de rendimiento.

El tercer escenario es la construcción de sistemas de clase de alojamiento e informática que incluyen un controlador, pero se ven privados de cualquier plataforma de nivel superior con la que integrarse. Una de las opciones para implementar este escenario supone un controlador Agile Controller-DCN SDN separado. Los administradores del sistema pueden usar esta arquitectura para realizar las operaciones diarias de administración de la red. Una versión más avanzada del tercer escenario se basa en la interacción de Agile Controller-DCN con VMware vCenter, unida por cierto proceso de negocio, pero nuevamente sin un sistema de administración de nivel superior.

El cuarto escenario es notable: la integración con una plataforma ascendente basada en OpenStack o nuestro producto de virtualización FusionSphere. Registramos muchas solicitudes de soluciones arquitectónicas similares, entre las cuales OpenStack es la más popular (CentOS, Red Hat, etc.). Todo depende de qué orquestación y plataforma de administración de recursos de cómputo se use en el centro de datos.

El quinto escenario es completamente nuevo. Además de los conocidos conmutadores de hardware, incluye un conmutador virtual distribuido CloudEngine 1800V (CE1800V), que solo puede funcionar con un KVM (máquina virtual basada en kernel). Esta arquitectura implica combinar Agile Controller-DCN con la plataforma de contenedorización de Kubernetes utilizando el complemento CNI. Por lo tanto, Huawei se mueve junto con todo el mundodesde la virtualización del host hasta la virtualización del sistema operativo .

Más sobre contenedorización

Anteriormente hemos mencionado el conmutador virtual CE1800V implementado utilizando Agile Controller-DCN. En combinación con los conmutadores de hardware de Huawei, forman una especie de "superposición híbrida". En un futuro próximo, los scripts de contenedor de Huawei recibirán soporte para NAT y funciones de equilibrio de carga.

Una limitación de la arquitectura es que el CE1800V no se puede usar por separado del Agile Controller-DCN. También debe tenerse en cuenta que un PoD de la plataforma Kubernetes no puede contener más de 4 millones de contenedores.

La conexión a la red VXLAN del centro de datos se realiza a través de VLAN (Red de área local virtual), pero existe una opción en la que el CE1800V actúa como VTEP con el proceso BGP (Border Gateway Protocol). Esto permite que las rutas BGP se intercambien con la red troncal sin la necesidad de interruptores de hardware separados.

Redes dirigidas por intención: redes de análisis de intención

Huawei presentó el concepto Intent-Driven Network (IDN) en 2018. Desde entonces, la compañía ha continuado trabajando en redes que permiten la computación en la nube, big data e inteligencia artificial para analizar los objetivos e intenciones de los usuarios.

Básicamente, estamos hablando de pasar de la automatización a la autonomía. La intención expresada por el usuario se devuelve en forma de recomendaciones de los productos web sobre cómo implementar esa intención. Esta funcionalidad se basa en las capacidades de Agile Controller-DCN que se agregarán al producto para garantizar que se incorpore la ideología de IDN.

En el futuro, con la introducción de IDN, será posible implementar servicios de red con un solo clic, lo que implica el más alto grado de automatización. La arquitectura modular de las funciones de red y la capacidad de combinar estas funciones le permitirán al administrador simplemente especificar qué servicios deberían estar disponibles en un segmento de red en particular.

Para lograr este nivel de controlabilidad, el proceso ZTP (Zero Touch Provisioning) es esencial. Huawei ha hecho avances significativos en esto, ofreciendo la capacidad de desplegar completamente la red desde el primer momento.

El proceso adicional de instalación e implementación necesariamente incluye un procedimiento para verificar la conectividad entre recursos (conectividad de red) y evaluar los cambios en el rendimiento de la red según sus modos de funcionamiento. Esta etapa implica llevar a cabo una simulación antes de comenzar la operación real.

El siguiente paso es el aprovisionamiento de servicios y la verificación realizada por las herramientas integradas de Huawei. Entonces solo queda controlar el resultado.

Todo el viaje ahora se completa con un único motor de extremo a extremo impulsado por el iMaster NCE, que contiene el Agile Controller-DCN y el Sistema de gestión de elementos eSight (EMS).

En este momento, Agile Controller-DCN puede verificar la disponibilidad de recursos y la presencia de conexiones, así como responder de manera proactiva (después de la aprobación del administrador) a los problemas en la red. La adición de los servicios necesarios ahora se realiza manualmente, pero en el futuro Huawei tiene la intención de automatizar esta y otras operaciones, como la implementación de servidores, la configuración de redes para sistemas de almacenamiento, etc.

Cadenas de servicio y microsegmentación

Agile Controller-DCN es capaz de manejar encabezados de servicio de red (NSH) contenidos en paquetes VXLAN. Esto es útil para crear cadenas de servicio. Por ejemplo, tiene la intención de enviar un cierto tipo de paquetes a lo largo de una ruta diferente de la que ofrece el protocolo de enrutamiento estándar. Antes de abandonar la red, deben pasar por algún tipo de dispositivo (firewall, etc.). Para hacer esto, es suficiente configurar la cadena de servicio que contiene las reglas requeridas. Debido a dicho mecanismo, es posible, por ejemplo, configurar políticas de seguridad, pero también son posibles otras áreas de su aplicación.

El diagrama muestra claramente el funcionamiento de las cadenas de servicio compatibles con RFC basadas en NSH, así como una lista de los conmutadores de hardware que las admiten.

Las capacidades de las soluciones de la cadena de servicios de Huawei se complementan con herramientas de microsegmentación, un método de seguridad de red que aísla los segmentos de seguridad hasta los elementos de carga de trabajo individuales. Sin pasar por el cuello de botella de la Lista de control de acceso (ACL), no es necesario configurar manualmente una gran cantidad de ACL.

Operación inteligente

Pasando al tema de la operación de la red, uno no puede dejar de mencionar otro componente de la marca paraguas iMaster NCE: el analizador de red inteligente FabricInsight. Proporciona amplias capacidades para recopilar telemetría e información sobre flujos de datos en la red. La telemetría se recopila mediante gRPC y acumula datos pasados, retrasados en el búfer y paquetes perdidos. La segunda gran variedad de información se agrega mediante ERSPAN (analizador de puerto de conmutador remoto encapsulado) y da una idea de los flujos de datos en el centro de datos. Básicamente, estamos hablando de recopilar encabezados TCP y la cantidad de información transmitida durante cada sesión TCP. Esto se puede hacer usando varios dispositivos Huawei; en el diagrama se presenta una lista de ellos.

SNMP y NetStream tampoco se olvidan, por lo que Huawei está utilizando mecanismos antiguos y nuevos para pasar de la red de caja negra a la red de la que literalmente sabemos todo.

Tejido AI: redes inteligentes sin pérdida

Las características de AI Fabric compatibles con nuestro hardware están diseñadas para transformar Ethernet en una red de alto rendimiento, baja latencia y sin pérdida de paquetes. Esto es necesario para implementar los escenarios principales para implementar aplicaciones en una red de centro de datos.

En el diagrama anterior, vemos los problemas que existe el riesgo de encontrar al operar la red:

paquete perdido;
desbordamiento de búfer;
El problema de la carga de red óptima cuando se utilizan enlaces paralelos.

El equipo de Huawei implementa mecanismos para resolver todos estos problemas. Por ejemplo, a nivel de chip, se implementó la tecnología de colas entrantes virtuales, que al mismo tiempo no permite el bloqueo en la entrada (bloqueo HOL).

A nivel de protocolo, existe un mecanismo ECN dinámico: cambio dinámico del tamaño del búfer, así como CNP rápido: envío rápido de paquetes de mensajes sobre un problema de red a la fuente.

La igualación de los derechos de las transmisiones de Elephant y Mice ayuda a admitir la tecnología de priorización dinámica de paquetes (DPP), que consiste en colocar piezas cortas de datos de diferentes transmisiones en una cola separada de alta prioridad. Por lo tanto, los paquetes cortos "sobreviven" mejor en el entorno de corrientes largas y pesadas.

Permítanos aclarar que para que los mecanismos anteriores funcionen de manera efectiva, deben ser apoyados directamente por el equipo.

Todas estas funciones se aplican en uno de los tres casos de uso para equipos Huawei:

al construir sistemas de inteligencia artificial basados en aplicaciones distribuidas;
al crear sistemas de almacenamiento de datos distribuidos;
al crear sistemas para computación de alto rendimiento (HPC).

Ideas encarnadas en "hardware"

Después de analizar los casos de uso típicos para las soluciones de Huawei y enumerar sus capacidades principales, pasemos directamente al equipo.

CloudEngine 16800 es una plataforma que proporciona trabajo en interfaces de 400 Gbps. Su rasgo característico es la presencia, junto con la CPU, de su propio chip de reenvío y un procesador de inteligencia artificial, que es necesario para implementar las capacidades de AI Fabric.

La plataforma está hecha de acuerdo con la arquitectura ortogonal clásica con un sistema de flujo de aire de adelante hacia atrás y viene con uno de los tres tipos de chasis: 4 (10U), 8 (16U) o 16 (32U) ranuras.

Se pueden usar varios tipos de tarjetas de línea en CloudEngine 16800. Entre ellos están los tradicionales de 10 gigabits y 40-, así como 100 gigabits, incluidos los completamente nuevos. Se planea el lanzamiento de tarjetas con interfaces de 25 y 400 Gbit / s.

En cuanto a los interruptores ToR (parte superior del bastidor), sus modelos actuales se indican en la línea de tiempo anterior. De mayor interés son los nuevos modelos de 25 gigabits, los conmutadores de 100 gigabits con enlaces ascendentes de 400 gigabits y los conmutadores de 100 gigabits de alta densidad con 96 puertos.

El interruptor principal de Huawei con una configuración fija en este momento es CloudEngine 8850. Debe ser reemplazado por el modelo 8851 con 32 interfaces de 100 Gb / sy ocho interfaces de 400 Gb / s, así como con la posibilidad de dividirlos en 50, 100 o 200 Gb / s ...

Otro conmutador de configuración fija, CloudEngine 6865, permanece en la línea de productos actual de Huawei. Es un caballo de batalla bien probado con acceso de 10/25 Gbps y ocho enlaces ascendentes de 100 Gbps. Agregar, también es compatible con AI Fabric.

El diagrama muestra las características de todos los nuevos modelos de interruptores, cuya apariencia esperamos en los próximos meses, o incluso semanas. Algunos retrasos en su liberación se deben a la situación en torno al coronavirus. Además, si bien los problemas de presión de sanciones sobre Huawei siguen siendo relevantes, sin embargo, todos estos eventos solo pueden afectar el momento de los estrenos.

Es más fácil obtener más información sobre las soluciones de Huawei y sus casos de uso suscribiéndose a nuestros seminarios web o contactando directamente a Huawei.

***

Le recordamos que nuestros expertos organizan regularmente seminarios web sobre productos Huawei y las tecnologías que utilizan. Una lista de seminarios web para las próximas semanas está disponible aquí .

Huawei DCN: cinco escenarios para construir una red de centro de datos