Como Site Reliability Engineer (SRE) com foco em monitoramento e observabilidade, utilizando o Datadog, sua missão será garantir a excelência operacional de sistemas de infraestrutura. Sua atuação será essencial para proporcionar suporte ágil às equipes de desenvolvimento e clientes, implementando práticas de DevOps assegurando a excelência operacional.
Responsabilidades:
* Implementar e configurar monitoramento avançado com Datadog, garantindo visibilidade em tempo real da performance e saúde dos sistemas;
* Definir e acompanhar métricas e alertas, integrando o Datadog a outras ferramentas e fluxos de trabalho para otimizar o tempo de resposta a incidentes e assegurar a estabilidade dos serviços em produção;
* Colaborar diretamente com cliente e equipe interna para atender demandas;
* Gerenciar Código Fonte (Git), garantindo boas práticas de versionamento e colaboração na equipe;
* Projetar e manter arquiteturas baseadas em contêineres (Docker, Kubernetes), garantindo alta disponibilidade e escalabilidade;
* Projetar e manter pipelines de CI/CD eficazes, automatizando testes, integração e implantação contínua;
* Selecionar, implementar e manter ferramentas de CI/CD alinhadas com os requisitos do projeto;
* Projetar, implantar e manter serviços em nuvem em plataformas como AWS;
* Configurar proxies e equilibradores de carga para otimizar o desempenho e a resiliência;
* Implementar e manter soluções de monitoramento e logging para garantir a visibilidade operacional;
* Participar com troubleshooting de networking (triagem, packet loss e roteamento);
* Desenvolver scripts e automações usando linguagens como bash e PowerShell.
Requisitos:
* Experiência com monitoramento e observabilidade usando Datadog;
* Conhecimento em monitoramento (Prometheus, Kibana, Grafana, Elasticsearch);
* Experiência com sistemas distribuídos (arquiteturas, micro-serviços, alta disponibilidade, eleições);
* Administração de containers;
* Experiência em serviços em nuvem;
* Conhecimento em proxies e load balancing (Nginx, HAProxy, Envoy);
* Experiência em logging (Splunk, SysLog, ELK Stack, Linux Journal, grep);
* Versionamento de código;
* Experiência com CI/CD;
* Conhecimento em Linux (bash, debugging);
* Networking (triagem, packet loss, routing);
* Conhecimento em linguagens como bash e PowerShell.
O que mais você encontra aqui:
* Liberdade com responsabilidade: Trabalhamos de forma 100% remota, permitindo que você atue de qualquer lugar (anywhere office).
* Cultura de Desenvolvimento: Avaliação de desempenho, plano de desenvolvimento individual (PDI), Programa Investindo em Você, Programa de Desenvolvimento de Talentos.
* Saúde e Qualidade de Vida: Programa de Saúde e Bem-Estar, plano de saúde, plano odontológico, equilíbrio entre vida pessoal e profissional, desafios de saúde e prática esportiva.
* Programa Dividir para Multiplicar: Trabalhamos de forma colaborativa e dividimos os lucros!
* Day Off de Aniversário: Escolha um dia no mês do seu aniversário para aproveitar, comemorar e descansar.
* Auxílio Equipamento/Home Office.
* Vale Flexível: Benefício para gastos diários.
* Programa de Indicação Premiada: Indique pessoas incríveis para trabalhar conosco e ganhe $$.
* Seguro de Vida: Proteção e segurança para você e sua família.
Conheça a Evoluum:
Conduzimos a transformação digital de empresas, atuando com squad as a service, outsourcing, discovery, consultorias de arquitetura de software e soluções especializadas em nuvem. Potencializamos o crescimento e a inovação, tornando a jornada para o futuro tecnológico uma experiência descomplicada e eficiente para nossos clientes.
Aqui na Evoluum prezamos pela liberdade de ser você e todas as nossas vagas são destinadas a todas as pessoas. Valorizamos as diferenças de todas as identidades de gênero, origem, crença, religião, orientação sexual e afetiva, deficiência, raça, etnia, idade, condição de saúde e/ou social, nacionalidade, corpo e quaisquer atributos intrínsecos à pluralidade humana. Buscamos pessoas que acreditam no valor da liberdade e da confiança, que tenham empatia e respeitam as diferenças, que sejam colaborativas e estejam prontas para evoluir.
#J-18808-Ljbffr