Cómo automatizamos las cargas y otras tareas de analistas ad-hoc con Zeppelin

En el momento de escribir este artículo, Cardsmobile, que desarrolla la aplicación móvil Wallet, emplea a 195 personas: 8 analistas y 187 clientes analistas potenciales. Hacemos una aplicación para usuarios finales, además de trabajar con minoristas, bancos, marcas y otros socios. Durante mucho tiempo, el trabajo de un analista en Wallet consistió no solo en estudios de comportamiento del usuario, sino también en diversas descargas, análisis típicos para socios y previsiones para clientes potenciales. Por supuesto, los tableros fueron un gran salvavidas y permitieron a toda la empresa rastrear el desempeño del producto. Pero seguimos perdiendo tiempo en el resto de la rutina, y con el crecimiento del equipo (clientes) y del negocio, nos quedamos estancados: había demasiadas tareas ad-hoc, y la investigación, el deseo de desarrollar y un futuro brillante se quedaron inactivos en ausencia de tiempo.







Hay tantas conferencias interesantes, artículos interesantes sobre varios estudios analíticos, ciencia de datos, datos basados ​​en datos, felicidad de datos. Y miramos toda esta belleza y no sabíamos dónde encontrar tiempo para experimentos entre toda la corriente de la rutina. Mucha gente habla sobre cómo hacerlo genial, pero pocos dicen cómo superar la creciente rotación y liberar recursos para tareas interesantes y creativas. En este artículo les contaré sobre nuestra experiencia de entrar en un futuro mejor. A continuación, se muestran ejemplos de cómo automatizamos las tareas ad-hoc de los analistas en Zeppelin .







imagen







¿Qué es Zeppelin?



Zeppelin es un cuaderno de código abierto de Apache que te permite acceder a diferentes bases de datos en diferentes lenguajes (Python, R, SQL, Spark). Pero lo que lo hace especialmente genial es el conjunto de elementos visuales: formas dinámicas .







api Amplitude, Clickhouse, MSSQL Python. Excel html-, .







notebook, . Zeppelin , : , – ! , . , . Zeppelin, . , !









Input – . , . , , .







imagen







Select – . . . , .







imagen







Checkbox – . , , , . , . , .







imagen







Zeppelin



, , , .







-. , , . . , .







:







  • , . Zeppelin . , . , , , .
  • . , . : , . , , «». - — , , - .
  • . «» , -. , , .


, . . .







imagen







, . , . , - , .







. - . , . , , . notebook Zeppelin, , . notebook .







/B-, base-line . , , , . 4 base-line :









Zeppelin , , , , .







imagen







Amplitude . - (, , ). : . — — . . , . , , :







  • , …
  • 5 10
  • ,
  • 2
  • ,


, . . - , .







, , Clickhouse, Amplitude api. , , . Amplitude, , , , .







:







  • - Amplitude. .
  • id ,
  • notebook Zeppelin
  • , Amplitude
  • sub_id notebook


:







  • id api Amplitude
  • DataFrame Python
  • /
  • , ( )
  • csv-,


-, , : . Amplitude . , , .







imagen









, , , – . , . , , . , , , , . slack , :







  • , , Retention.
  • , . support. . , , .
  • . , .
  • , - , Zeppelin , . , .


Success. ,



– ! Ad-hoc . 10%. , , . , . , .







: . , , . , , . . , .







Data- , , .








All Articles