Inteligencia artificial y aprendizaje automático en la difusión por Internet: tendencias recientes





Hola, Habr. Mi nombre es Alexander Alpern, soy el CEO y fundador del Webinar Group. Hoy me gustaría discutir temas como el uso de tecnologías de aprendizaje automático e inteligencia artificial en la transmisión por Internet, el procesamiento de contenido multimedia y su entrega al usuario.



¿Para qué sirve? Aumentar las vistas, la lealtad del espectador, el contenido informativo de los programas, así como la reducción de la carga en la red son solo una parte de las ventajas que brindan las tecnologías modernas.



Pandemia + tráfico = problemas



Según TeleGeography, que analizó los tipos de cambio del tráfico global de Internet, el consumo de tráfico se disparó en 2020. Por lo tanto, el promedio global aumentó de aproximadamente 120 a 170 Tbps, en su punto máximo: 300 Tbps.



imagen



En principio, el crecimiento ya era bastante grande, pero el año pasado se batieron todos los récords: el crecimiento fue del 47%. El ataúd se abre simplemente: cientos de millones de personas fueron encerradas en sus casas, por lo que la actividad de usar mensajeros de Internet, plataformas de aprendizaje en línea, servicios de juegos en la nube y, por supuesto, plataformas de video como YouTube ha aumentado dramáticamente.



Los puntos de intercambio de tráfico más cargados se encontraban en Alemania, Frankfurt (DE-CIX FRA) y en los Países Bajos, Amsterdam (AMS-IX). En marzo, el centro peer-to-peer DE-CIX alcanzó un pico de tráfico histórico de 9.1 Tbps .



En Rusia, se observó una situación similar: en marzo-abril de 2020, los cines en línea registraron un aumento de tráfico de 2 a 4 veces. La razón sigue siendo la misma: debido a la pandemia y el autoaislamiento, las personas estaban aisladas en sus propios apartamentos y casas, por lo que Internet se ha convertido en una de las formas de entretenerse. El tráfico móvil en el mismo período creció entre un 10% y un 30%, principalmente debido a los chats de video y la mensajería instantánea.



Llegó al punto en que Netflix y YouTube bajaroncalidad de video para usuarios europeos. YouTube comenzó a mostrar videos en definición estándar en lugar de HD, y Netflix redujo la resolución en un 25%.



¿Qué hacer?



Idealmente, aumente la capacidad y el rendimiento de la infraestructura de red, tanto a nivel local como global. Todo es complicado aquí, ya que los proveedores de Internet, comunicaciones celulares y otros servicios de telecomunicaciones no siempre pueden invertir recursos importantes.



La segunda opción es optimizar su contenido. Esto se refiere no tanto a reducir la calidad de video o audio, como a otros métodos. Los consideraremos a continuación.



Optimización de la compresión de diferentes videos



Netflix es el mayor proveedor de contenido multimedia. Hace varios años, introdujo la práctica de seleccionar diferentes perfiles de compresión para diferentes videos, teniendo en cuenta sus características.



Netflix tiene una gran experiencia en video, incluida la compresión de contenido. Usando sus propios desarrollos, la compañía entrenó un sistema de tipo neuronal que evalúa los atributos de video de bajo nivel, determina su clase y luego encuentra los parámetros óptimos para cada clase.



Se evalúan parámetros como la dinámica de la imagen, el grado de claridad y la complejidad general de la trama. En cuestión de minutos, el sistema evalúa la dinámica de la trama, el grado de claridad y la saturación general de la "imagen". Basado en los datos del análisis, el sistema toma una decisión sobre la optimización del video. Por lo tanto, si el programa o la transmisión no son muy dinámicos, la calidad del video se puede reducir. Si la imagen cambia rápidamente, los colores están saturados y la trama es compleja, entonces la calidad disminuye ligeramente o permanece en el mismo nivel.



imagen



Por lo tanto, se logra la optimización de la transmisión de video, se reduce la carga en la infraestructura de red. El trabajo con video se lleva a cabo de tal manera que el resultado final es invisible para los consumidores de contenido. En otras palabras, la audiencia simplemente no nota nada. Para la compresión, la empresa utilizaVarios códecs y modelos de compresión, incluido 4K VMAF , para que la red no se congestione incluso cuando se transmite video 4K.



Seleccionar la fuente de video con una calidad óptima



Una alta resolución y, por lo tanto, una gran cantidad de datos transmitidos, no significa que se entregue un video de buena calidad al destinatario. Un ejemplo de esto es el gif publicado arriba.



La elección de una fuente de vídeo de buena calidad es un problema urgente para los distribuidores de paquetes de canales de televisión. Ssimwave ha creado una solución de aprendizaje automático que selecciona automáticamente la fuente de contenido con la más alta calidad.



imagen



Un ejemplo es la transmisión del canal CNN. En una fuente, los parámetros de video son 1080 @ 29.97i, MPEG-2, 40 Mbps, y en la otra, con 720p60, H264, 22 Mbps. Como se mencionó anteriormente, una alta resolución no significa en absoluto una buena calidad de video para el destinatario. La calidad está influenciada por una gran cantidad de factores, incluidos los formatos de compresión y color, el rango dinámico, los procedimientos de transcodificación, las tecnologías de entrega y las versiones de los reproductores de abonados.



Es simplemente imposible evaluar todo esto manualmente. Pero la red neuronal puede hacer frente a la tarea sin ningún problema. Ssimwave pudo desarrollar una solución que le permite seleccionar la fuente de transmisión con la mayor calidad y el mínimo volumen de datos en cuestión de segundos.



No solo por el tráfico



El aprendizaje automático, la inteligencia artificial y las redes neuronales ayudan no solo a optimizar el volumen de contenido transmitido. Hay muchas otras áreas donde la tecnología es simplemente indispensable ahora.



Navegación por catálogo de videos



Muchas empresas de contenido multimedia tienen catálogos, con juegos, videos, películas y programas. Según Netflix, al elegir una película para ver, es más probable que los suscriptores presten atención a los íconos de los carteles de películas. Según el director creativo de la compañía, Nick Nelson, en el 82% de los casos, la elección de una película está determinada por el icono / póster presentado.



En consecuencia, cuanto más exitosa sea la imagen, mayor será la probabilidad de que el espectador elija este contenido en particular. Todo esto es relevante no solo para el video, sino también para otros productos digitales.



imagen



Para confirmar o refutar la opinión de Nelson, Accedo se ha asociado con AWS y British Television Corporation ITV para ejecutar una prueba A / B para identificar los factores que influyen en las elecciones de los usuarios. La conclusión no es demasiado sorprendente: los usuarios eligen una película, guiados por sus emociones al ver capturas de pantalla. Se tarda menos de 2 segundos en evaluar la captura de pantalla.



En consecuencia, las tecnologías de inteligencia artificial y aprendizaje automático se pueden utilizar para seleccionar capturas de pantalla con conversiones óptimas. Para las películas, tales capturas de pantalla generalmente incluyen una imagen de un héroe cuyo rostro expresa emociones, y la mayoría de las veces se eligen imágenes con antagonistas. Las capturas de pantalla con grupos de héroes son de menor interés.



Además, la inteligencia artificial ayudó a formar diferentes colecciones para diferentes categorías / segmentos de espectadores, tanto social como geográficamente. Ahora bien, no es de extrañar que los catálogos se vean diferentes en diferentes países o regiones del mismo país. Pero hace solo 10-20 años, la situación era diferente.



Incrementar el contenido de información del video.



imagen



Se trata de crear y estructurar metadatos multimedia para diferentes videos, por ejemplo, videos deportivos. IBM Watson, una supercomputadora de IBM con inteligencia artificial incorporada, se destacó en particular aquí. Puede crear descripciones visuales en tiempo real, transcribir audio, agregar notas editoriales.



Estas habilidades se utilizan al trabajar con eventos deportivos populares, por ejemplo, la Copa del Mundo, el US Open, el Super Bowl y otros.



AI procesa el flujo de transmisión, marca puntos clave en él, agrega notas y comentarios. Además, el flujo ya procesado se envía a los editores del programa de transmisión o se transmite directamente a los espectadores.



Reducción de la rotación de clientes



El aprendizaje automático y la inteligencia artificial son excelentes para prevenir la pérdida de clientes. Esto sucede si el interés de los usuarios por el contenido disminuye. Según nuestros datos, el contenido poco interesante o demasiado complejo puede provocar la deserción de una cuarta parte de los usuarios. Esto es mucho y no debería permitirse.



Para reducir la tasa de abandono, es importante:



  • entender lo que puede causar la deserción
  • automatizar análisis
  • utilizar herramientas de previsión


Analytics utiliza datos como la información del usuario, la visibilidad del contenido, las calificaciones de los usuarios, la actividad de interacción del usuario con soporte (aquí podemos hablar no solo de videos, sino también de cursos en línea, como en nuestro caso) y otros datos. Por ejemplo, en la plataforma We.Study, el propio sistema "monitorea" regularmente el curso, brindando recomendaciones específicas para mejorarlo, lo que le permite rastrear el comportamiento de los participantes y predecir la deserción.



Con base en los resultados del análisis, se pueden tomar ciertas acciones - para cambiar el contenido, el programa de capacitación, si se trata de cursos - para mejorar la interacción con los usuarios.



Personalizar el contenido destacado



imagen



Todos los usuarios de YouTube saben cuál es el contenido recomendado. Cuanto más exitosa sea la recomendación, mayor será la probabilidad de que el usuario vea el video o vea otro tipo de contenido.



Caso ilustrativo: el proyecto IBM Watson y la plataforma Iris.tv. Los socios lograron lograr una personalización óptima del contenido. Para hacer esto, los videos primero se pasan a través de una supercomputadora que recopila metadatos. Luego, la plataforma analiza estos datos para crear nuevas categorías y títulos de la filmoteca.



Además, con la ayuda del aprendizaje automático, la plataforma pudo capacitarse para analizar los intereses de usuarios específicos con el fin de garantizar ofrecer un video interesante a una persona después de haber visto el siguiente programa.



¿Que sigue?



Hay muchos casos de uso de inteligencia artificial y aprendizaje automático, por lo que solo se indican los puntos más reveladores en el artículo. La conclusión general es que estas tecnologías se están comenzando a utilizar de forma sistemática. Anteriormente, se usaban solo como prueba. Ahora, cientos y miles de empresas de contenido utilizan el aprendizaje automático para optimizar el contenido, depurar procesos comerciales, atraer nuevos usuarios y retener los antiguos.



Durante los próximos 3 a 5 años, la inmensa mayoría de los proveedores de contenido de medios cambiarán al uso de tecnologías modernas, debido al hecho de que permiten resolver los problemas tanto de los clientes individuales como de la empresa en su conjunto.



All Articles