Buscamos uma liderança experiente para o time de Robust Incident Management, responsável por garantir a excelência na gestão de incidentes, desde o monitoramento e abertura de chamados, até o acionamento das equipes responsáveis e o acompanhamento da resolução. Sua atuação será crucial para assegurar a estabilidade e disponibilidade dos serviços da Magalu Cloud.
O que você fará: Liderar e desenvolver o time, promovendo um ambiente colaborativo e de alta performance. Garantir o monitoramento, registro, priorização e tratamento de incidentes de ponta a ponta. Acionar equipes de engenharia internas e fornecedores, assegurando a comunicação eficiente. Acompanhar a resolução de incidentes, garantindo o cumprimento de SLAs e a qualidade do atendimento. Analisar incidentes recorrentes, identificar causas raízes e propor soluções preventivas. Manter e otimizar as métricas de performance do time (MTTA, MTTR, etc.), buscando a melhoria contínua. Comunicar o status dos incidentes às partes interessadas, mantendo a transparência e a eficiência na comunicação. Para atuar nessa função, é essencial que você tenha conhecimento em: Sistemas operacionais, redes e infraestrutura de TI. Ferramentas de monitoramento (Grafana, Prometheus, etc.) e gestão de chamados. Metodologias de gestão de incidentes (ITIL, etc.) e frameworks ágeis (Scrum, Kanban). Análise de dados e resolução de problemas, com foco em otimização de processos É imprescindível que você tenha experiência com: Gestão de incidentes em ambientes críticos e de alta disponibilidade. Liderança de equipes de suporte ou SRE, com foco em desenvolvimento de pessoas. Comunicação clara e eficaz com equipes técnicas e não técnicas, incluindo stakeholders de negócio. Trabalho sob pressão e em ambientes dinâmicos, com capacidade de tomar decisões rápidas e assertivas. Serão considerados diferenciais: Certificações em ITIL, SRE ou áreas relacionadas. Se você se identifica com essa oportunidade, venha fazer parte do nosso time e construir o futuro da infraestrutura conosco!
Na Magalu Cloud, temos grande autonomia e responsabilidade, somos multidisciplinares, auto gerenciáveis e com pouca burocracia no nosso cotidiano. Buscamos romper as barreiras que diminuem nossa capacidade de agregar valor ao negócio. Fazemos entregas frequentes e agimos rapidamente ao encontrar problemas; nosso ritmo é acelerado, mas temos tranquilidade e equilíbrio para planejar e executar nossas tarefas com qualidade.