Saltar al contenido principal

Umbrales y reglas de alerta

Las reglas de alerta conectan un monitor con un canal de notificación y definen qué eventos disparan una notificación. Puedes crear varias reglas por monitor para enviar diferentes eventos a diferentes canales.


Anatomía de una regla de alerta

Cada regla tiene:

CampoDescripción
CanalDestino al que se envía la notificación (email, Slack, Discord, webhook…).
Eventos activosQué transiciones de estado disparan una alerta.
Activa / InactivaPermite desactivar temporalmente una regla sin eliminarla.

Eventos configurables

EventoCuándo se activa
Caído (DOWN)El monitor pasa a DOWN y se abre un incidente.
RecuperadoEl monitor pasa de DOWN a UP y se cierra el incidente.
Inestable (DEGRADED)El monitor pasa a DEGRADED (latencia alta, ping tardío en Heartbeat, etc.).
Estable tras degradaciónEl monitor sale de DEGRADED hacia UP.
Certificado SSL próximo a vencerSolo para monitores SSL; el certificado expira dentro del umbral configurado.
Certificado SSL vencidoSolo para monitores SSL; el certificado ya ha caducado (complementa la alerta DOWN).

Recuperación tras DEGRADED

Si «Estable tras degradación» no está activo pero «Recuperado» sí lo está, una transición DEGRADED → UP enviará igualmente la alerta de recuperación. Esto asegura que no te pierdas la recuperación aunque no tengas configurado el evento específico de DEGRADED.


Umbral de fallos consecutivos

El umbral de fallos consecutivos define cuántos checks fallidos seguidos se necesitan antes de disparar la alerta DOWN. Evita falsas alarmas por fallos momentáneos de red.

Por ejemplo, con un umbral de 2:

  • Check 1: DOWN → sin alerta todavía.
  • Check 2: DOWN → se confirma el fallo, se abre el incidente y se envía la alerta.

El consenso multi-región añade una capa adicional: aunque un solo probe falle, si los demás probes de otras regiones reportan UP, no se considera caída confirmada. Ver Validación multi-región.


Configuración de varias reglas por monitor

Puedes crear múltiples reglas para el mismo monitor:

  • Enviar la alerta DOWN a Slack #alertas y también por email al responsable.
  • Enviar DEGRADED solo a un canal de métricas (sin despertar a nadie).
  • Enviar las alertas de SSL próximo a vencer a un canal de seguridad diferente.

Cada regla es independiente: puedes activar o desactivar cada una sin afectar a las demás.


Ejemplo: configuración recomendada para un servicio crítico

Regla 1 — Canal "Slack #incidentes"
✅ Caído (DOWN)
✅ Recuperado
☐ Inestable (DEGRADED)
☐ Estable tras degradación

Regla 2 — Canal "Email equipo"
✅ Caído (DOWN)
✅ Recuperado
☐ Inestable (DEGRADED)
☐ Estable tras degradación

Regla 3 — Canal "Slack #métricas"
☐ Caído (DOWN)
☐ Recuperado
✅ Inestable (DEGRADED)
✅ Estable tras degradación

Alertas durante mantenimiento

Cuando un monitor está en modo mantenimiento, las alertas de disponibilidad (DOWN, recuperación) no se envían aunque el check falle. Las alertas de certificado SSL siguen activas si así lo has configurado.


Relacionado