Esteganografía y ML. ¿O lo que obtuvimos de las redes generativas adversarias (GAN)?





La esteganografía es la ciencia de transmitir información en secreto ocultando el hecho mismo de la transmisión. Y la palabra esteganografía en sí misma proviene del griego. στεγανός “oculto” + γράφω “Yo escribo” y literalmente significa “escritura secreta”. En esta área, como en muchas otras, especialmente en los últimos años, los métodos de aprendizaje automático se han generalizado, en particular, las redes generativas adversarias (GAN). 



Siguiente en el menú:



  1. Esteganografía tradicional para tontos 
  2. ¿Qué es GAN y con qué se comen?
  3. Entonces, ¿cómo se aplican las GAN?
  4. El futuro de GAN: ¿qué nos espera en esteganografía?


Esteganografía tradicional para tontos



Desde la antigüedad, la gente ha utilizado la esteganografía clásica como un medio de comunicación secreta: tinta invisible, poesía tibetana y más. La esteganografía moderna utiliza comunicaciones electrónicas y tecnología digital para ocultar un mensaje. Cada estegosistema moderno consta de dos componentes principales: algoritmos de inyección y extracción. Entonces, el algoritmo de inyección toma como entrada un mensaje secreto, una clave secreta y un contenedor que se utilizará para transferir el mensaje. El resultado de su trabajo es un mensaje stego.



Generalmente, un mensaje puede ser cualquier cosa: texto, imagen, datos de audio, etc. Para cada tipo de datos, se desarrollan sus propios enfoques de ocultación. Entonces, en la esteganografía de texto, se usan suposiciones en la ubicación y el número de caracteres en el texto, que no se tienen en cuenta al leer a una persona. Por ejemplo, una de las técnicas es formatear. Su esencia consiste en una línea que se divide aumentando los espacios entre palabras, cuando un espacio corresponde, por ejemplo, al bit 0, y dos espacios al bit 1. O, en la esteganografía de red, la información oculta se transmite a través de redes informáticas utilizando las peculiaridades de los protocolos de transferencia de datos. Las técnicas típicas de esteganografía de red implican cambiar las propiedades de uno de los protocolos de red. En el futuro, consideraremos solo la esteganografía en imágenes,respectivamente, llamaremos a los mensajes stego transmitidos imágenes stego.



Más sobre stegosystems
  ,   1 .   ,   ,   . : , / , , .







– , . — , . .



,   .



. , . , «» ,   . ,   . .



  . , , ,  .   ,   , .



    .   , .   , .



En la esteganografía de imágenes, se distinguen tres arquitecturas fundamentales diferentes según diferentes métodos de obtención de imágenes estego.



1) modificación de la imagen



Básicamente, existen dos tipos de enfoques de modificación de la esteganografía. El primer tipo se  ocupa de respaldar el modelo estadístico y el  segundo   implementa la incorporación como resultado de minimizar una función de distorsión particular.



2) Selección de imágenes



La selección de imágenes se trata de elegir el contenedor correcto e implica dos enfoques principales. El primero es seleccionar una imagen candidata para su modificación. En este método, debe encontrar un contenedor adecuado para la modificación en la base de datos. Aunque estos métodos se denominan selección de imágenes, son esencialmente una modificación con algún paso adicional. Pero en el futuro no consideraremos este método como independiente. Otro enfoque consiste en seleccionar un contenedor como imagen stego sin modificaciones. En este enfoque, es importante establecer reglas para la correspondencia entre el mensaje y la imagen de stego.



3) síntesis de imágenes



La tercera estrategia se basa en la síntesis de imágenes. Y aquí nuestra Alice (esteganógrafa) intenta crear una nueva imagen que contiene la información necesaria. Dado que la síntesis de una imagen realista es un problema complejo, el método tradicional resuelve los problemas de la esteganografía creando imágenes "no naturales", como  texturas  o  imágenes de una huella dactilar .



¿Qué es GAN y con qué se comen?



La red generativa adversaria (GAN, por sus siglas en inglés) es un algoritmo de aprendizaje automático no supervisado que se basa en una combinación de dos redes neuronales. En 2014, fue introducido por primera  vez por  Google. En un sistema GAN, una de las redes genera patrones y la otra intenta distinguir patrones "genuinos" de los incorrectos. 



Una red generativa, que utiliza un conjunto de variables de espacio de latencia, siempre intenta moldear una nueva muestra mezclando varias muestras originales. La red discriminativa D está capacitada para distinguir entre muestras genuinas y falsas. Al mismo tiempo, sus resultados se alimentan a la entrada de la red generativa G para que pueda seleccionar el mejor conjunto de parámetros latentes, y la red discriminativa ya no podrá distinguir las muestras genuinas de las falsas. Como puede ver, el objetivo de la red G es aumentar el porcentaje de errores en la red D, y el objetivo de la red D es, por el contrario, mejorar la precisión del reconocimiento.



Las GAN han encontrado excelentes aplicaciones en la visión por computadora y  el procesamiento del lenguaje natural  (en la generación de imágenes y textos). Pero al mismo tiempo, la esteganografía no se salvó.



Entonces, ¿cómo se aplican las GAN?



Las capacidades de GAN se pueden ver desde diferentes ángulos: juego competitivo, generador o función de visualización. Son consistentes con la clasificación de las principales estrategias en esteganografía, es decir, modificación, síntesis y selección.



1) modificación de la imagen



La modificación de imagen basada en GAN se centra en el juego de confrontación entre el esteganógrafo y el esteganizador. Este método utiliza un generador capacitado para construir varios elementos "clave". Hay tres estrategias principales.



Crear imagen stego



Denis Volkhonsky, Ivan Nazarov y Evgeny Burnaev  propusieron  diseñar un generador para crear una imagen stego. Este enfoque permite un mensaje stego más a prueba de esteganálisis que puede transmitir mensajes utilizando algoritmos de esteganografía estándar. De hecho, presentaron una red generativa adversaria que consta de tres redes: generador G, discriminador D y clasificador S de esteganálisis.



El clasificador S determina si la imagen realista oculta información clasificada.







Crear matriz de probabilidad de modificación



Un ejemplo es  ASDL-GAN  para aprender automáticamente la función de distorsión. Este esquema opera en la tradición de la esteganografía moderna y minimiza la función de distorsión aditiva. La propia matriz de probabilidad de cambio se obtiene minimizando la expectativa matemática de la función de distorsión. El generador G en su esquema está entrenado para reconocer las probabilidades de cambiar P de la imagen de entrada.



Juego adversario



La tercera estrategia implica el uso directo de un juego competitivo entre tres de sus participantes (Alice, Bob, Wendy) para estudiar el algoritmo de modificación. Un método  ADV-EMB que intenta cambiar la imagen para ocultar el mensaje engañando al clasificador de esteganálisis.



En este enfoque, los píxeles de la "imagen candidata" se dividen en dos grupos, un grupo de píxeles se usa para la modificación y el segundo grupo de píxeles se usa para crear perturbaciones con el fin de resistir el analizador.



2) Selección de imágenes



La esteganografía de selección GAN tiene como objetivo establecer la relación entre el mensaje y la imagen estego. Sin embargo, no hay muchas fuentes sobre este tema, aunque algunos trabajos hacen intentos separados  en esta dirección.



Una idea es que el remitente establece el tipo de visualización mediante un generador entre el mensaje y la imagen seleccionada. Para el destinatario, el mensaje se genera directamente a partir de la imagen seleccionada. La esencia de este método es establecer la relación entre la imagen y el mensaje secreto para que el contenedor se convierta naturalmente en una imagen estego. El análisis esteganográfico estadístico no funciona porque la operación de modificación en sí no se realiza directamente.



3) síntesis de imágenes



La imagen generalmente se crea con un generador sobreentrenado y aquí se sugieren varias estrategias.



Aprendiendo con un profesor



Aquí, los  autores usan una red neuronal para estudiar un algoritmo de aprendizaje adversario en el que tres jugadores (Alice, Bob y Eve) representan redes neuronales.







Alice usa el contenedor y el mensaje secreto para crear una imagen stego, mientras Bob intenta recuperar el mensaje. Eve extrae la probabilidad P del mensaje secreto de la imagen. Al mismo tiempo, Alice intenta lograr un equilibrio en el que la probabilidad de que Eve reciba una imagen con un mensaje secreto es 1/2. (es decir, Eva ya está tratando de adivinar arbitrariamente el resultado). Este algoritmo introduce tres funciones de pérdida, de las que Alice, Bob y Eve son responsables, respectivamente.



Aprender sin maestro



Esteganografía sin modificación



En este método,  los mensajes secretos se convierten en un vector de ruido, que se envía al generador como entrada para crear una imagen estego.



Primero, el generador G está entrenado con algún conjunto de datos. Esto produce un generador que puede crear imágenes realistas. Durante la segunda fase, el extractor E se entrena utilizando la función de pérdida de extracción de mensajes. El objetivo de este paso es recuperar el mensaje de la imagen stego generada.



En el último paso, el remitente establece la relación entre el ruido y el mensaje, y el mensaje secreto y los vectores de ruido se segmentan para crear un mapeo. El receptor puede usar el extractor para reconstruir el vector de ruido, y luego se obtiene el mensaje secreto usando el mapeo resultante.



Esteganografía WGAN-GP



En este enfoque, el  extractor de mensajes y el generador de imágenes stego se entrenan simultáneamente. WGAN-GP está adaptado para generar imágenes stego con mayor calidad. De acuerdo con el método propuesto, el Generador G aprende la entrada del minimax del juego (una regla de decisión para minimizar posibles pérdidas de aquellas que el tomador de decisiones no puede evitar en el peor de los casos para él) para competir con el Discriminador (D) y el Extractor (E ).







Formación de profesores parciales



Esteganografía ACGAN



Para realizar un entrenamiento parcial, se debe agregar una red auxiliar específica de la tarea al GAN ​​original.  Este método  establece una relación entre las etiquetas de clase de la imagen generada y la información secreta, con las etiquetas de clase y el ruido inyectados directamente en el generador para generar la imagen estego. En la etapa de extracción del mensaje, la imagen stego se envía al discriminador para obtener fragmentos de información secreta.



Esteganografía de muestreo limitada



 En este caso, la  operación de incrustación de mensajes se convierte en un problema de selección de imágenes. El artículo considera la creación de una imagen stego como un problema de minimizar la distancia entre la imagen original y la imagen stego.



Esteganografía utilizando el ciclo de Ghana



Algunos investigadores consideran la síntesis de la imagen stego como un problema de traducción "imagen a imagen". Un modelo muy famoso de traducción de imágenes es  CycleGAN . Este modelo aprende a convertir una imagen de clase X a clase Y minimizando la función de pérdida por adversarios y la función de pérdida de consistencia de bucle. El artículo  sostiene que CycleGAN puede verse como un proceso de codificación para ocultar información.



El futuro de GAN: ¿qué nos espera en esteganografía?



Los métodos basados ​​en GAN son extremadamente interesantes y prometedores para la taquigrafía. Este enfoque tiene actualmente tres direcciones principales de desarrollo. El futuro de GAN: ¿qué nos espera en esteganografía?



Capacidad



En métodos como GAN-CSY, la inestabilidad de los píxeles generados conduce a una pobre precisión en la recuperación de mensajes. En otros métodos, el mensaje no existe en su forma habitual, sino que es un atributo de categoría o un vector de ruido. La desventaja es que los mensajes de los métodos existentes no incluyen mucha información. Por lo tanto, una de las áreas que requiere atención es mejorar la estabilidad y aumentar el volumen de datos transmitidos.



Evaluación de la calidad de la imagen



Es difícil cuantificar la calidad de las imágenes sintéticas. En el campo de la síntesis de imágenes, los criterios para evaluar las imágenes generadas no son lo suficientemente fiables.



Algunos métodos que utilizan la evaluación manual son subjetivos y carecen de criterios objetivos para la evaluación. Los criterios de evaluación actuales son principalmente IS (Inseption Score) y FID (Frechet Inception Distence). Estas calificaciones solo tienen en cuenta la autenticidad y calidad de la imagen. Por tanto, encontrar estimaciones adecuadas sigue siendo una línea de investigación importante y sin desarrollar.



Esteganálisis



La tarea del esteganálisis se divide en dos etapas. La primera etapa es el examen de las imágenes, que mostrará si la imagen es falsa. El segundo paso es la organización de la imagen, que determina si la imagen generada contiene un mensaje secreto. Actualmente, las imágenes generadas por la GAN son indistinguibles para el

ojo humano. En la esteganografía tradicional, existen muchos métodos para examinar imágenes con el fin de distinguir entre imágenes naturales y generadas. Pero en el futuro, con el desarrollo de los enfoques descritos, será difícil determinar si la imagen se genera o no. En consecuencia, el aumento de la eficiencia del esteganálisis debe reconocerse como la dirección más prometedora.



El material se preparó en base a  este artículo.



All Articles