🏛️ London's Premier Job Portal
Propósito del rol:
Diseñar, implementar y evolucionar la estrategia de observabilidad end-to-end para sistemas críticos, garantizando disponibilidad, resiliencia y experiencia del cliente.
Responsabilidades principales:
- Diseñar soluciones de observabilidad (logs, métricas, trazas)
- Implementar estándares de instrumentación (Open Telemetry)
- Integrar herramientas como Datadog, Dynatrace, Prometheus, Grafana Splunk, New Relic
- Crear dashboards basados en SLIs/SLOs
- Gestionar alertamiento inteligente y análisis de incidentes
- Reducir MTTR mediante automatización
- Integrar herramientas como Datadog, Dynatrace, Prometheus, Grafana
Requisitos:
- +4 años en observabilidad, SRE o Dev Ops
- Experiencia en entornos críticos de alta disponibilidad
- Conocimiento en cloud (AWS, Azure o GCP)
- Experiencia con Kubernetes y Docker
Competencias:
- Pe...