Hablemos de registro centralizado

Este artículo es una continuación del texto sobre seguimiento . Aquí propongo hablarles sobre el papel de los registros en la evaluación del estado del sitio observado, ver qué nos pueden dar y también plantear la pregunta: "¿es posible separar los registros de las métricas?"





En el camino, volveré a algunas de las tesis expresadas en la publicación anterior, por lo que te recomiendo que primero te familiarices con ella.





Así que hablemos de la tala.





Por cierto, ¿qué será correcto: registro o registro? Personalmente, me inclino por la segunda opción, simplemente porque loGGing, pero me doy cuenta de que la mayoría de la gente prefiere la primera. ¿Y tú?






Interrogación

Antes de comenzar un nuevo artículo, quiero volver brevemente al anterior. En los comentarios se plantearon varios temas a los que, en mi opinión, conviene dar algunas sugerencias.





¿Recoger todo o solo la cantidad mínima?

Aquí mi posición es que debe recopilar todas las métricas que el objeto puede proporcionar. Como señaló @BugM, están en la base de datos, no piden comida, no molestan a nadie. Pero si no los tiene, pero de repente los necesitaba, especialmente durante, digamos, el mes pasado, no se puede hacer nada.





: « – , , , ».





ML, . , , () . , , ( ML), .





, , ?

. , , :





… ,





, , . , . , .





@sizziff .





«» , 150%, , , :





Ingeniero inundado de alertas
,

@Dr_Wut :





— , — spf. , , . — .





, , - , – , .





- -

.





- – «» , (, …). – .





- - – , - . , – BI-.





.





.






, , , , , , , .





, , . :





– ; , :





2019-04-23 00:39:10,092  INFO  DatabaseConnector – Connection estabilished
      
      



. – . /, , , .





– ; , . API. , , Nginx:





66.249.65.62 - - [06/Nov/2014:19:12:14 +0600] "GET /?q=%E0%A6%A6%E0%A7%8B%E0%A7%9F%E0%A6%BE HTTP/1.1" 200 4356 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
      
      



. , .





– , .





: , , , , – , , , , . , , , , , .





, « ?».





– , , .





– , database_error_count. , , - , , ( ) . :





2019-04-27 00:39:10,092  ERROR  DatabaseConnector – Error connecting to database MSSQLDB – connection refused on port 1433
      
      



– .





, . , , «» , , , , , , .





, . -, , , , … !





– HTTP- , , , , , , :





, , , . Observability – .





? ? ? ? , .





:





  • (99% - API - - , - )





  • (- API)





  • ( )





. .





, HTTP – .





. :





  1. DMZ (trace ID) ; !





  2. , , -, , -,





, trace ID , – .





, :





– , :









  • ;









, – Pull Push.





Pull – ( , , ), , //- . – ; – , .





Push – / / . , , .





, , ( , ), .





– plain text, jsonl, logsft, . – , .





– , .





:





@timestamp<time>:      
application<string>:  ,    ;      
host<string>:         ,    
log_type<string>:     ; application|access|.... (     application )
trace_id<string>:      ( )
      
      



.





, :





message<string>:           
generic_message<string>:    
level<string>:              
level_value<int>:           
logger_name<string>:      ,   ( )
thread_name<string>:      ,   ( )
stack_trace<string>:      ;     -      ( )
      
      



:





status_code<int>:              
elapsed_time<int>:          ,      
requested_resource<string>:  
method<string>:              
      
      



.





, .





:





  • – NoSQL , , . , , –





  • – , - , . , ,





, , «EMERGENCY», , , , , . , «FATAL» - .





, «generic_message». .





– ( , ).





– , . :





:





Error on AMQP connection <0.12956.79> (127.0.0.1:52879 -> 127.0.0.1:5672, state: starting):
      
      



, :





Error on AMQP connection <{connection_id}> ({remote_host} -> {destination_host}, state: {connection_state}):
      
      



.





? :





  • ; , , . ,





  • ; «session_id»





  • , ( , ), ( )





. .





, . Elasticsearch, , , Loki . , - https://habr.com/ru/company/badoo/blog/507718/.





, , .





:

























, ( , ).





:





  1. - , ERROR





  2. – , ( , )





  3. , – , , ,





:





El usuario de seguimiento se mueve de arriba hacia abajo, analizando el incidente.
,

, :





  • ;





  • , ; , ,





, ?





, – , , . .





, , , – .





Quizás más adelante aparezca otro artículo, ya con ejemplos del uso de tecnologías y prácticas específicas, en el que intentaremos implementar lo descrito anteriormente y ver cómo funciona.








All Articles