Detección profunda de anomalías

Detección de anomalías mediante técnicas de aprendizaje profundo

La identificación de anomalías (o valores atípicos) en los datos es un desafío para los científicos e ingenieros de diversos campos de la ciencia y la tecnología. Aunque la detección de anomalías (objetos sospechosamente no similares al conjunto de datos principal) ha estado involucrada durante mucho tiempo y los primeros algoritmos se desarrollaron en los años 60 del siglo pasado, en esta área hay muchos problemas sin resolver que enfrentan las personas en áreas como consultoría, scoring bancario, seguridad de la información, transacciones financieras y salud. En relación con el rápido desarrollo de algoritmos de aprendizaje profundo en los últimos años, se han propuesto muchos enfoques modernos para resolver este problema para varios tipos de datos estudiados, ya sean imágenes, grabaciones de cámaras de CCTV, datos tabulares (sobre transacciones financieras), etc.

- Deep Anomaly Detection (DAD) - :

  • : . . - , ,

  • :

  • :

  • : , , , ( - )

:

  • precision / ( )

[2] G. Pang .

higo.  1
. 1

:

Deep learning for feature extraction - , ( ), . DAD. 

.2 . φ(·) : X→ Z Z, .

higo.  2. Aprendizaje profundo para la extracción de funciones
. 2. Deep learning for feature extraction

Learning feature representation of normality - φ(·) : X→ Z , , Z .

higo.  3. Representación característica de aprendizaje de la normalidad
. 3. Learning feature representation of normality

End-to-end anomaly score learning - end-to-end , anomaly score.

higo.  4. Aprendizaje de puntaje de anomalías de extremo a extremo
. 4. End-to-end anomaly score learning

,   .

Deep learning for feature extraction

. , PCA (principal component analysis) [3] random projection [4], , . MLP, , NNs , RNNs ().

, anomaly score .

Learning feature representation of normality

.1 .

Generic Normality Feature Learning. . , .



ψ  - , l - , ψ, φ ( ), f - .

  :



DAD , , . [5]

- , , , .

φ_e (.) - , φ_d (.)  - , . s_x (data reconstruction error) .

Generative Adversarial Networks

GANs - , , ( G) , ( D) .

G D - .

DAD , . , , . AnoGAN [6].

Predictability Modeling. .



x̂_(t +1) = ψ (φ (x1 , x2 , · · · , xt ; Θ); W),

l_pred l_adv - , .

, , . . [7]

Self-supervised Classification. , ( -  (n - 1) , - , ). . , .

Anomaly Measure-dependent Feature Learning.

φ(·) : X→ Z, .



l - .

:

  • Distance-based Measure. , : DB outliers [8], k-nearest neighbor distance [9] . -  , .

  • One-class Classification-based Measure. , , , . one-class SVM [10], Support Vector Data Description (SVDD) [11].

  • Clustering-based Measure. , , [12].

End-to-end anomaly score learning

  , anomaly score.

:





τ (x; Θ) : X→ R , .

Ranking Models. end-to-end . , . Self-trained deep ordinal regression model [13].

Prior-driven Models. - the Bayesian inverse RL-based sequential anomaly detection. - , .   [14].

Softmax Models. , . , .

Deviation Networks (end-to-end pipeline) [1]

,   G. Pang , . .5 .

higo.  cinco
. 5

function φ - anomaly scoring network, . Reference score generator - ,   ( ). ( φ(x; Θ) μ_R) deviation loss function L, anomaly scoring network , , .

deviation loss function



y = 1, , y = 0 . , anomaly score , φ(x; Θ), dev(x) , , "a" ( ). .

, , . SOTA-. end-to-end .

[1] Deep Anomaly Detection with Deviation Networks. G. Pang

[2] Deep Learning for Anomaly Detection: A Review. G. Pang

[3] Emmanuel J Candès, Xiaodong Li, Yi Ma, and John Wright. 2011. Robust principal component analysis?

[4] Ping Li, Trevor J Hastie, and Kenneth W Church. 2006. Very sparse random projections.

[5] Alireza Makhzani and Brendan Frey. 2014. K-sparse autoencoders. In ICLR.

[6] Thomas Schlegl, Philipp Seeböck, Sebastian M Waldstein, Ursula Schmidt-Erfurth, and Georg Langs. 2017. Unsupervised anomaly detection with generative adversarial networks to guide marker discovery.

[7] Wen Liu, Weixin Luo, Dongze Lian, and Shenghua Gao. 2018. Future frame prediction for anomaly detection–a new baseline.

[8] Edwin M Knorr and Raymond T Ng. 1999. Finding intensional knowledge of distance-based outliers.[9] Fabrizio Angiulli and Clara Pizzuti. 2002. Fast outlier detection in high dimensional spaces.

[10] Bernhard Schölkopf, John C Platt, John Shawe-Taylor, Alex J Smola, and Robert C Williamson. 2001. Estimating the support of a high-dimensional distribution.

[11] David MJ Tax and Robert PW Duin. 2004. Support vector data description.

[12] Mathilde Caron, Piotr Bojanowski, Armand Joulin, and Matthijs Douze. 2018. Deep clustering for unsupervised learning of visual features.

[13] Guansong Pang, Cheng Yan, Chunhua Shen, Anton van den Hengel, and Xiao Bai. 2020. Self-trained Deep Ordinal Regression for End-to-End Video Anomaly Detection. 

[14] Andrew Y Ng y Stuart J Russell. 2000. Algoritmos para el aprendizaje por refuerzo inverso.




All Articles