Aprendizaje automático de la interacción de funciones mediante redes neuronales autoadaptativas


La predicción de la tasa de clics (CTR), cuyo objetivo es predecir la probabilidad de que un usuario haga clic en un anuncio o producto, es fundamental para muchas aplicaciones en línea, como anuncios en línea y sistemas de asesoramiento (recomendación). Este problema es muy complejo porque: 1) las funciones de entrada (por ejemplo, identificación del usuario, edad del usuario, identificación del artículo, categoría del artículo) suelen ser escasas; 2) la predicción eficaz se basa en funciones combinatorias de alto orden (también conocidas como funciones cruzadas), que requieren mucho tiempo para el procesamiento manual por parte de expertos en el dominio y no son enumerables. Por lo tanto, se han realizado esfuerzos para encontrar representaciones de baja dimensión de objetos en bruto escasos y de alta dimensión y sus combinaciones significativas. 

En este artículo, proponemos un método AutoInt eficiente y efectivo para analizar automáticamente las interacciones de objetos de alto orden de los objetos de entrada. Nuestro algoritmo propuesto es muy general y se puede aplicar a características de entrada tanto numéricas como categóricas. En particular, comparamos características tanto numéricas como categóricas en el mismo espacio de baja dimensión. Luego, se propone una red neuronal autoajustable multipropósito con conexiones residuales para modelar explícitamente las interacciones de características en un espacio de baja dimensión. Con la ayuda de diferentes capas de redes neuronales autoestresadas multipropósito, es posible simular diferentes órdenes de combinaciones de características de entrada. El modelo completo se puede aplicar de manera efectiva a datos brutos a gran escala de manera integral.Los resultados experimentales en cuatro conjuntos de datos reales muestran que nuestro enfoque propuesto no solo es superior a los enfoques de pronóstico modernos existentes, sino que también proporciona un buen poder explicativo de la red.El código está disponible en .

1. Introducción 

Predecir la probabilidad de que los usuarios hagan clic en anuncios o productos (también conocido como predicción de tasas de clics) es un tema crítico para muchas aplicaciones web, como la publicidad en línea y los sistemas de recomendación [8, 10, 15]. La efectividad del pronóstico tiene un impacto directo en los ingresos finales de los proveedores comerciales. Por su importancia, está generando un interés creciente tanto en el ámbito académico como en el comercial. 

. 2. .   3    . 4. . 5 .  ,   6.


: 1)   -; 2) ; 3) .  


   -, [8-10, 15, 21, 29, 43]. , Google   Wide&Deep[8] , ,    . . . ,   . [31] -   , <, , >. Oentaryo  . [24]    . 


,  .    () [26], [27, 28].   . ,    (FFM) [16] . GBFM [7] AFM [40] .   . 

, . , NFM [13] . , PNN [25], FNN [41], DeepCrossing [32], Wide&Deep [8]  DeepFM [11] . ,   . , , . -, Deep&Cross [38]  xDeepFM [19]   . , ,  – . -, [39, 42, 44] , , . -, HOFM [5] . HOFM ,   ( 5) . ,    . 


: [2] [12].

[2] , [35], [30] [14, 33, 43].   . [36]  - . 

[12]  ImageNet. , y = F (x) + x, , . 


(CTR) : 

1. ( CTR) x ∈ R n u v, , n -  . , u v x

CTR , x  , . , x ,  . . , , [6, 8, 11, 23, 26, 32]. 

Figura 1: Descripción general de nuestro modelo AutoInt propuesto.  Los detalles de la capa incrustable y la capa interactiva se muestran en las Figuras 2 y 3, respectivamente.
,   . 

2 ( p-).  x ∈ R n p- g (xi1 , ..., xip ),     , p- , g (·) - , [26] [19, 38]. , xi1 × xi2- , xi1 xi2

. . ,    . , .   . 

3 ( ).  x ∈ Rn , - x, . 

4. Autoint:    

 AutoInt, CTR. , ,   . 


, . .1, x, , (. . , ) . , () . ,  , . . 

,    . . 

Figura 2: Ilustración de las capas de entrada e incrustación, donde los campos categóricos y numéricos están representados por vectores densos de baja dimensión.
, . , 

M - ,  xi - i- . xi -  , i- (, x1 . 2). xi -  , i- (, xM  . 2). 


, (, ). ,  , . ., 

 Vi - i,  xi - . ,  xi - . . , , (, «»). 2 : 

q - , i- ,  xi - - . 

, . ,  

 vm - m,  xm - . 

, , .2. 


   , . , , . , . - - [36]. 

   (Multi-head self-attentive network) [36] . , [36] [20], [37].   . 

,  «-» [22], , . m, , , m. m k  () h

ψ (h) (·, ·) - , m k. ,  ⟨·, ·⟩. - .

W(h)Query, W(h)Key ∈ Rd′ × d 5 - ,  Rd   Rd′. m h, , α(h)m, k

(6) m ( h), , . , , , . , , : 

 ⊕ - , H - . 

 3:   .     , .. α (h) m.
, (. . ) , . , 

 W Res ∈ R d ′ H × d - [12], ReLU (z) = max (0, z) - . 

 em  eResm,   . . , . 


{eResm }Mm=1, , , , ()  . CTR , : 

w ∈ R d ′ H M - , , b - , σ (x) = 1 / (1 + e−x) .  


- , : 

 yj  yˆj - CTR , j , N - . , : 

 logloss  . 

4.7  AutoInt 

. , 5-8, , . 

, (. . M = 4), x1, x2, x3 x4 . (, 5) , , , g (x1, x2), g (x2, x3) g ( x3, x4)   ,   g (·) ( 2)  ReLU (·). , x1, eRes1.    , , . 

, . eRes1 eRes3, , , x1, x2 x3, , eRes1 eRes3, eRes1 g (x1, x2), eRes3 x3 ( ). , . , g (x1, x2, x3, x4) Res 1 Res 3, g (x1, x2) g (x3 , x4) . , . 

, ,  AutoInt  , , . , [3, 18]. 


, [11, 19, 32],  nd , n - , d - . : {W (h) Query, W (h) Key, W (h) Value, WRes}, L- L × (3dd ′ + d ′ Hd),    M. , d ′ HM + 1 . , O (Ldd′H). , H d ′ (, H = 2 d′ = 32 ), . 


. -,  ( )  O(Mdd' + M2d' ) . O(Mdd' + M2d') . H  (), O(MHd' (M + d)) . ,  H,d  d ' .  AutoInt  5.2. 


. : 

RQ1)   AutoInt  CTR?  ? 

RQ2)  ? 

RQ3)  ?  ? 

RQ4)  ? , . 

 1:    .
1: .


5.1.1  . . 1. 

Criteo.  CTR, 45   . 26   13 .  

Avazu.  , , . 23 , / .  

KDD12.  KDDCup 2012, . CTR, , (1 > 0, 0 ), FFM [16].  

MovieLens-1M.  .  ( )  3 , , . 3    –  , 3.  

. -, ( ) «<>», {10, 5, 10}  Criteo, Avazu  KDD12 . -, , , z  log2(z) z> 2,     Criteo Competition. -, 80%    .  

5.1.2  . : 

AUC ROC (AUC)  , CTR , . AUC . 

Logloss.   logloss , 10, .  

, AUC  Logloss  0,001 CTR, [8, 11, 38]. 

5.1.3  . : A) , ; )   , ; C) , . . 

LR (). LR .

FM [26] (B). FM .

F [40] (B). AFM - , . FM, ,   . 

DeepCrossing [32] (C). DeepCrossing     .

NFM [13] (C). NFM . . 

CrossNet [38] (). -,  Deep&Cross, .

CIN [19] (C). ,  xDeepFM, .

HOFM[5] (). HOFM .    Blondel et al. [5]   [13], , . 

 CrossNet  CIN,  Deep&Cross  xDeepFM,  plain DNN (. . 5.5). 

5.1.4  .  TensorFlow[1].  AutoInt  d 16, - 1024. AutoInt  , d 32.  ( ) - . , [34] {0.1 - 0.9} MovieLens-1M, ,   . 200 - NFM, . CN CIN AutoInt. DeepCrossing  100, . ,   . ,  Adam [17] , . 

 2:    .  ,                .      5.2.
5.2  (RQ1) 

.  , 10 , 2. : 1) FM AFM, , LR , , CTR; 2)  - , ; ,  DeepCrossing  NFM , FM AFM  ,  (, CIN ); 3) HOFM FM  Criteo  MovieLens-1M, , ; 4) AutoInt  .  

 Avazu CIN ,  AutoInt  AUC,  Logloss. ,  AutoInt  ,  DeepCrossing, , , . 

 4.         . "DC”  “CN” -  DeepCrossing  CrossNet  , .  HOFM            KDD12,        .      5.2.
  4. , LR - . FM NFM , NFM   . CIN, , - . . , AutoInt ,  DeepCrossing  NFM. 

( ) . 3, CIN  AutoInt  . 

, ,  AutoInt  . CIN, AutoInt  -. 

 3:             Criteo. «DC»  «CN» -  DeepCrossing  CrossNet  , .     .
5.3  (RQ2)  ,   AutoInt. 

5.3.1  .  AutoInt  , , , . , , . 4, , . ,   KDD12 MovieLens-1M, , . 

 4:  ,   AutoInt      . AutoInt w –   ,     AutoInt w/o –     .
5.3.2  .  ( 4). ,     , . , ( ), , . 

5. , , , , , . , . . , . , , , . 

 5:     .   Criteo,  Avazu  ,  , , .
 6:     .   Criteo,  Avazu  ,  , , .
5.3.3  .    d, . KDD12 , , . MovieLens-1M. 24, . , , , . 

5.4  (RQ3) 

, . ,  AutoInt  . MovieLens-1M.  

, , . . 7 () , .  ,  AutoInt  <Gender=Male, Age=[18-24), MovieGenre=Action&Triller> (. . ).  , , , . 

Tabla 5: Resultados de la integración de interacciones de funciones implícitas.  Indicamos el modelo básico para cada método.  Las dos últimas columnas representan los cambios medios en AUC y Logloss en comparación con los modelos de referencia correspondientes ("+": aumento, "-": disminución).
, . . . 7 (). , <Gender, Genre>, <Age, Genre>, <RequestTime, ReleaseTime> <Gender, Age, Genre> (. . ) , . 

Figura 7: Mapas de ponderaciones de atención térmicas (fase) para interacciones de funciones globales y de casos en MovieLens-1M.  Los ejes representan los campos de función <Sexo, Edad, Ocupación, Código Postal, RequestTime, RealeaseTime, Genre>.  Destacamos algunas de las funciones combinatorias estudiadas en rectángulos.
5.5 (RQ4) 

     CTR [8, 11, 19]. , ,  AutoInt  .  AutoInt+ : 

  • Wide&Deep [8]. Wide&Deep  ; 

  • DeepFM [11]. DeepFM      ; 

  • Deep&Cross [38]. Deep&Cross-  CrossNet  ; 

  • xDeepFM [19]. xDeepFM - CIN . 

5 ( 10 ) .  : 1)   ,   , , , , , ,   AutoInt  ; 2) , AutoInt+ ,     CTR. 


CTR, -, .     , . . , . ,   , AUC  Logloss    . 

    -. ,  AutoInt  , , . 

