Buscamos uma liderança experiente para o time de Robust Incident Management, responsável por garantir a excelência na gestão de incidentes, desde o monitoramento e abertura de chamados, até o acionamento das equipes responsáveis e o acompanhamento da resolução. Sua atuação será crucial para assegurar a estabilidade e disponibilidade dos serviços da Magalu Cloud.
O que você fará:
* Liderar e desenvolver o time, promovendo um ambiente colaborativo e de alta performance.
* Garantir o monitoramento, registro, priorização e tratamento de incidentes de ponta a ponta.
* Acionar equipes de engenharia internas e fornecedores, assegurando a comunicação eficiente.
* Acompanhar a resolução de incidentes, garantindo o cumprimento de SLAs e a qualidade do atendimento.
* Analisar incidentes recorrentes, identificar causas raízes e propor soluções preventivas.
* Manter e otimizar as métricas de performance do time (MTTA, MTTR, etc.), buscando a melhoria contínua.
* Comunicar o status dos incidentes às partes interessadas, mantendo a transparência e a eficiência na comunicação.
Para atuar nessa função, é essencial que você tenha conhecimento em:
* Sistemas operacionais, redes e infraestrutura de TI.
* Ferramentas de monitoramento (Grafana, Prometheus, etc.) e gestão de chamados.
* Metodologias de gestão de incidentes (ITIL, etc.) e frameworks ágeis (Scrum, Kanban).
* Análise de dados e resolução de problemas, com foco em otimização de processos
É imprescindível que você tenha experiência com:
* Gestão de incidentes em ambientes críticos e de alta disponibilidade.
* Liderança de equipes de suporte ou SRE, com foco em desenvolvimento de pessoas.
* Comunicação clara e eficaz com equipes técnicas e não técnicas, incluindo stakeholders de negócio.
* Trabalho sob pressão e em ambientes dinâmicos, com capacidade de tomar decisões rápidas e assertivas.
Serão considerados diferenciais:
* Certificações em ITIL, SRE ou áreas relacionadas.
Se você se identifica com essa oportunidade, venha fazer parte do nosso time e construir o futuro da infraestrutura conosco!
Na Magalu Cloud, temos grande autonomia e responsabilidade, somos multidisciplinares, auto gerenciáveis e com pouca burocracia no nosso cotidiano. Buscamos romper as barreiras que diminuem nossa capacidade de agregar valor ao negócio. Fazemos entregas frequentes e agimos rapidamente ao encontrar problemas; nosso ritmo é acelerado, mas temos tranquilidade e equilíbrio para planejar e executar nossas tarefas com qualidade.