Los mejores productos de datos nacen en los campos.

La mayorĂ­a de nuestros pedidos en lĂ­nea se obtienen de almacenes, no de almacenes. Esto conduce a errores entre lo que se muestra en el sitio y lo que realmente podemos armar en un pedido en  lĂ­nea .

Debido a la alta tasa de rotación de mercancías en las tiendas y la complejidad de los sistemas de gestión de existencias, se producen errores que pueden detectarse automáticamente. Según nuestro conocimiento de los sistemas y el uso de la ingeniería social, propusimos una solución que encontraría automáticamente productos problemáticos y ajustaría sus existencias antes de publicar en el sitio.





imagen



,    Â« ».    2011 . (  ,   13, 107),       ,   Data- .



«»



   ,   ,   «».       ,  .



  •  â€”  .
  •  â€” ,     .
  •  â€” .
  •  â€” .
  •  â€” 5   .




,   ,      Â« »,  98%         .



8 000 .  , 40 000   .   , ?   ,   , ,   ,  ,  .   ,      - , , - « ».   ,   ,     -  .



-    ,  â€”   .



  ,     ,     Data Accelerator.  â€” data-,   data-driven.  Data Accelerator 126 ,   5      â€” « »,     .



 ,    ,   ,   . ,    .



  : Data Scientist, Data Engineer, Data Analyst, Product Owner  Scrum-.



:



  • ,     (  );
  •  eCom,    .


 , .





,    ,  ,  :   . ,   ,   3 , ,    ,   6 . , , ,    â€¦



      ,       . . « » ,   ,   .



,  â€”    . ,    ,        .   ,     ,   1. , , ,    .   .  .



imagen

 â€” .  ,   . , , .   2500 ,   43,    .        «».



imagen



,   excel-,  ,     excel-  :   ,   .   ,  , ,   , , .



,   ,  60%   , .      ,    81%, ,  -, .



MVP.



 6 ,   proof of concept   , ,   ,  .    ,   ,   .

, , ,   ,   ,    â€” ,   , .    ,     , , .



«-1».



  ,   ,   : « ,   , , , ».     , , « » ,    .     4  , .



   ,   . -,   ,   , - , , .     ,       . -, ,        . ,  ,      .



ML-.



,   ML-,     6 .   ML-?



  •    Catboost,   ,     .
  •     ,        .
  •     ,     ,  ,  ,   ,  ,    .
  •   70 .
  •     ,   Permutation Importance  ,   Catboost.
  •   ,       80/20.
  •   ,     .
  • ,    ,     ,    train/valid-.
  •     DVC,    S3.


  :



  • ROC-AUC: 0.68
  • Recall: 0.77




 â€”    .   ,   DataLake   GreenPlum.   ,  MongoDB,  .   GreenPlum  MongoDB   opensource- Apache- Apache AirFlow  Apache NiFi.



Python-,  Kubernetes.     ,   -   Apache Kafka,   ,         Apache Kafka.



imagen



  6    ,   15%    12%,   E-com   . ,   ,   .



  ,    ,    .   ,    â€” ,   ,     .           .



p.s. Avito.Tech, .






All Articles