SRE и наблюдаемость
Разборы и инженерные заметки по теме «SRE и наблюдаемость» — с практическими примерами и выводами из опыта.
-
Четыре золотых сигнала: что они правда ловят и почему стек — VictoriaMetrics + Loki
Что каждый из четырёх сигналов реально ловит, и три ловушки, при которых «у нас мониторинг есть» оказывается дашбордом с зелёными галочками над сломанным сервисом.
Читать -
Error budget как кнопка «стоп»: SLO без паники и multi-burn-rate
Error budget превращает надёжность в ресурс, который можно тратить, а multi-burn-rate — в алерт, который будит дежурного по делу.
Читать