Umbrales y reglas de alerta
Las reglas de alerta conectan un monitor con un canal de notificación y definen qué eventos disparan una notificación. Puedes crear varias reglas por monitor para enviar diferentes eventos a diferentes canales.
Anatomía de una regla de alerta
Cada regla tiene:
| Campo | Descripción |
|---|---|
| Canal | Destino al que se envía la notificación (email, Slack, Discord, webhook…). |
| Eventos activos | Qué transiciones de estado disparan una alerta. |
| Activa / Inactiva | Permite desactivar temporalmente una regla sin eliminarla. |
Eventos configurables
| Evento | Cuándo se activa |
|---|---|
| Caído (DOWN) | El monitor pasa a DOWN y se abre un incidente. |
| Recuperado | El monitor pasa de DOWN a UP y se cierra el incidente. |
| Inestable (DEGRADED) | El monitor pasa a DEGRADED (latencia alta, ping tardío en Heartbeat, etc.). |
| Estable tras degradación | El monitor sale de DEGRADED hacia UP. |
| Certificado SSL próximo a vencer | Solo para monitores SSL; el certificado expira dentro del umbral configurado. |
| Certificado SSL vencido | Solo para monitores SSL; el certificado ya ha caducado (complementa la alerta DOWN). |
Recuperación tras DEGRADED
Si «Estable tras degradación» no está activo pero «Recuperado» sí lo está, una transición DEGRADED → UP enviará igualmente la alerta de recuperación. Esto asegura que no te pierdas la recuperación aunque no tengas configurado el evento específico de DEGRADED.
Umbral de fallos consecutivos
El umbral de fallos consecutivos define cuántos checks fallidos seguidos se necesitan antes de disparar la alerta DOWN. Evita falsas alarmas por fallos momentáneos de red.
Por ejemplo, con un umbral de 2:
- Check 1: DOWN → sin alerta todavía.
- Check 2: DOWN → se confirma el fallo, se abre el incidente y se envía la alerta.
El consenso multi-región añade una capa adicional: aunque un solo probe falle, si los demás probes de otras regiones reportan UP, no se considera caída confirmada. Ver Validación multi-región.
Configuración de varias reglas por monitor
Puedes crear múltiples reglas para el mismo monitor:
- Enviar la alerta DOWN a Slack #alertas y también por email al responsable.
- Enviar DEGRADED solo a un canal de métricas (sin despertar a nadie).
- Enviar las alertas de SSL próximo a vencer a un canal de seguridad diferente.
Cada regla es independiente: puedes activar o desactivar cada una sin afectar a las demás.
Ejemplo: configuración recomendada para un servicio crítico
Regla 1 — Canal "Slack #incidentes"
✅ Caído (DOWN)
✅ Recuperado
☐ Inestable (DEGRADED)
☐ Estable tras degradación
Regla 2 — Canal "Email equipo"
✅ Caído (DOWN)
✅ Recuperado
☐ Inestable (DEGRADED)
☐ Estable tras degradación
Regla 3 — Canal "Slack #métricas"
☐ Caído (DOWN)
☐ Recuperado
✅ Inestable (DEGRADED)
✅ Estable tras degradación
Alertas durante mantenimiento
Cuando un monitor está en modo mantenimiento, las alertas de disponibilidad (DOWN, recuperación) no se envían aunque el check falle. Las alertas de certificado SSL siguen activas si así lo has configurado.