Na Bemobi valorizamos o espírito inovador e colaboramos para que pessoas potencializem o seu melhor e, juntos, identificamos afinidades e oportunidades.
Se você procura desenvolvimento, desafios e um ótimo ambiente de trabalho, está no lugar certo!
Estamos em busca de um(a) profissional sênior para liderar a operação contínua dos sistemas em um ambiente de cloud hosting. Esse(a) profissional será responsável por gerenciar o NOC 24x7, acompanhar e conduzir todo o ciclo de vida de incidentes (desde a detecção até a resolução), realizar análises post-mortem, implementar melhorias contínuas e garantir a governança de processos de mudança (Change Management). Além disso, atuará diretamente na definição e execução de planos para mitigação de problemas, buscando soluções de causa raiz e manutenção da estabilidade e confiabilidade dos serviços. #BeABemober Responsabilidades Principais • Gerenciar o NOC 24x7: Liderar a equipe de monitoramento e suporte, garantindo a alta disponibilidade e o bom desempenho dos sistemas em produção.
• Change Management: Definir, implementar e monitorar processos de gestão de mudanças (baseados em frameworks como ITIL) para minimizar riscos e impactos no ambiente de produção.
• Incident Management: Acompanhar e direcionar a resolução de incidentes críticos, assegurando escalonamento adequado, comunicação eficiente e cumprimento de SLAs.
• Root Cause Analysis: Conduzir post-mortems e elaborar relatórios de causas raiz (RCA), definindo e acompanhando planos de ação para prevenir recorrências.
• Continuidade de Negócios: Colaborar com áreas de Segurança da Informação e Governança de TI para garantir a conformidade com políticas e normas, visando a continuidade e resiliência dos sistemas.
• Observabilidade e Monitoramento: Definir e otimizar ferramentas de monitoramento (ex.: Datadog, Prometheus, Grafana, New Relic) para garantir visibilidade em tempo real dos sistemas e aplicações.
• Melhoria Contínua: Trabalhar em parceria com equipes de desenvolvimento (DevOps/SRE) para aprimorar processos de CI/CD, automatizar rotinas e implementar melhores práticas de operação em cloud.
• Gestão de Equipe Internacional: Recrutar, treinar e desenvolver talentos na área de operação, promovendo uma cultura de colaboração, responsabilidade e aprendizado contínuo.
Requisitos • Formação: Graduação em Engenharia da Computação, Ciência da Computação, Sistemas de Informação ou áreas correlatas (pós-graduação e certificações em ITIL, AWS, Azure, GCP são diferenciais).
• Experiência: Sólida vivência em operações de infraestrutura e suporte a ambientes de missão crítica (NOC ou similar), preferencialmente em modelo 24x7.
• Cloud Hosting: Conhecimento avançado em plataformas de cloud (AWS, Azure, GCP), incluindo serviços de computação, armazenamento, redes e automação.
• Frameworks e Metodologias: Familiaridade com ITIL, Lean, Agile e práticas de DevOps/SRE; experiência no uso de ferramentas de CI/CD (Jenkins, GitLab CI, etc.).
• Monitoramento e Observabilidade: Conhecimento em soluções de logging, métricas e tracing, bem como na configuração de alertas eficientes.
• Comunicação e Liderança: Excelentes habilidades de comunicação para atuar com equipes multidisciplinares, stakeholders de negócio e fornecedores. Capacidade de liderar times em situações de crise.
• Raciocínio Analítico: Perfil orientado a dados, capaz de correlacionar métricas e indicadores de performance para prever e mitigar problemas de forma proativa.
• Disponibilidade: Flexibilidade para lidar com escalas e eventuais emergências em horários não convencionais.
Espanhol ou Inglês fluente. Diferenciais • Certificações profissionais em Cloud (AWS Certified Solutions Architect, Azure Administrator, Google Cloud Architect).
• Certificações ITIL v3/v4 ou COBIT.
• Experiência na implementação de práticas de SRE (definição de SLIs, SLOs e SLAs).
• Vivência em ambientes com alto volume de transações e baixa latência (e-commerce, fintechs, etc.).