Estados del monitor (UP, DOWN, DEGRADED)
Cada monitor tiene en todo momento un estado que refleja la salud del servicio monitorizado. Hay cuatro estados posibles.
Estados
UP — Operativo
El servicio responde correctamente: código HTTP esperado, contenido válido, latencia dentro del umbral y todas las validaciones pasadas.
DEGRADED — Calidad degradada
El servicio responde pero con calidad inferior a la esperada. En monitores HTTP/API, la causa habitual es que la latencia de respuesta supera el umbral configurado. En monitores Heartbeat, DEGRADED significa que el ping llegó tarde — dentro de la ventana periodo + grace, pero fuera del periodo normal.
El estado DEGRADED se evalúa en monitores HTTP/API (por latencia) y Heartbeat (por ping tardío). Para monitores TCP, DNS, SSL y Ping (ICMP), el resultado es siempre UP o DOWN.
DEGRADED no abre un incidente de disponibilidad. Puede disparar alertas si la regla de alerta tiene activa la notificación de inestabilidad.
DOWN — Caído
El servicio no responde, devuelve un error, falla las validaciones o supera el timeout. Se abre un incidente automáticamente (si no estaba ya abierto y el monitor no está en mantenimiento).
UNKNOWN — Sin datos
Estado inicial cuando el monitor se acaba de crear y aún no se ha ejecutado ningún check. También aparece en monitores Heartbeat que aún no han recibido el primer ping válido.
Tabla de transiciones
| De → A | ¿Abre incidente? | ¿Envía alerta? |
|---|---|---|
| UP → DOWN | Sí | Alerta DOWN (si está activa en la regla) |
| DOWN → UP | Cierra incidente | Alerta de recuperación (si está activa en la regla) |
| UP → DEGRADED | No | Alerta de inestabilidad (si está activa en la regla) |
| DEGRADED → UP | No | Alerta de recuperación DEGRADED — o alerta de recuperación genérica si no se configuró la específica |
| DEGRADED → DOWN | Sí | Alerta DOWN (si está activa en la regla) |
| DOWN → DEGRADED | Cierra incidente | — |
Prioridad de evaluación
Cuando el probe devuelve el resultado de un check, se aplica este orden de prioridad:
- DOWN: fallo de disponibilidad crítico (timeout, error de red, código HTTP inesperado, validación fallida).
- DEGRADED: el servicio responde pero la latencia supera el umbral configurado.
- UP: disponibilidad y calidad correctas.
Consenso multi-región y anti-falsos positivos
Para monitores sintéticos (HTTP, TCP, DNS, SSL, Ping), el estado final no depende de un solo probe. Varios probes en distintas regiones participan en la misma ventana de medición por intervalo; el hub cierra esa ventana y entonces aplica consenso:
- Solo se declara DOWN cuando una mayoría de probes coinciden en el fallo en esa ventana cerrada.
- Un probe con problemas de red propios no es suficiente para abrir un incidente.
- Si la ventana cierra sin mayoría (por ejemplo, un probe no respondió a tiempo), puede mostrarse Sin confirmar sin cambiar el estado agregado del monitor.
Ver Validación multi-región y Medición parcial — Sin confirmar.
Mantenimiento y pausa
| Modo | Checks | Incidentes | Alertas |
|---|---|---|---|
| Normal | Ejecuta | Abre/cierra según estado | Envía según reglas |
| Mantenimiento | Ejecuta | No abre | No envía alertas de disponibilidad |
| Pausado | No ejecuta | No abre | No envía |
Visualización
Los estados se muestran con colores consistentes en todo el panel:
- Verde: UP
- Ámbar / naranja: DEGRADED
- Rojo: DOWN
- Gris: UNKNOWN / Pausado / Mantenimiento
En monitores con varios probes, las barras del historial reciente pueden mostrar además un intervalo gris «Sin confirmar» cuando ese intervalo no tuvo consenso regional completo. Eso es distinto de DEGRADED: no cambia el estado agregado del monitor. Ver Medición parcial — Sin confirmar.
En la página de estado pública, el estado se agrega por monitor y por grupo de monitores.