Position Overview
Estamos procurando um profissional para atuar na sustentação e evolução de sistemas em produção, sendo responsável por garantir a estabilidade, disponibilidade e rápida recuperação das aplicações, apoiando o time na resolução de incidentes complexos e na melhoria contínua do ambiente. RESPONSABILIDADES E ATRIBUIÇÕES Atuar no atendimento e gestão de fila de incidentes e requisições (modeloKanban / ITSM)Investigar, analisar e solucionar incidentes em ambientes produtivos
Realizar troubleshooting de integrações entre sistemas (APIs, filas, serviços distribuídos), identificando falhas, inconsistências e interrupções de processo
Analisar logs, métricas e traces para diagnóstico de problemas e identificação de causa raiz
Apoiar decisões técnicas relacionadas à estabilidade e performance das aplicações
Garantir a disponibilidade e confiabilidade dos sistemas, atuando com foco em SLA/SLO
Participar de situações críticas (war room), apoiando na comunicação técnica e resolução ráp...