El rol se centra en garantizar la estabilidad, monitorización y rendimiento de nuestra plataforma en entornos híbridos (Azure, AWS, On-Premise). No es solo un rol de despliegue, sino de garantía de servicio y "firefighting" eficiente, asegurando que las caídas de red o infraestructura se resuelvan en el menor tiempo posible (MTTR bajo).
Responsabilidades Clave
- Gestión de Incidentes y Resolución Rápida: Actuación inmediata ante incidencias de red, rendimiento o disponibilidad de la plataforma. Diagnóstico y reparación ágil de fallos críticos.
- Arquitectura y Gestión de Plataformas: Administración y optimización de clústeres Kubernetes (AKS, Rancher) y entornos híbridos (Azure, AWS, On-Premise).
- Automatización e Infraestructura como Código: Implementación de pipelines CI/CD (Jenkins...