Site reliability engineer ii

Eldorado do Sul

Meta

Anunciada dia 1 março

Descrição

O que procuramos?

Atribuições principais:

1. Prover guia técnico e mentor técnico a outros engenheiros;
2. Participar do desenvolvimento e manutenção da infraestrutura Cloud;
3. Colaborar nas decisões técnicas envolvendo arquitetura e infraestrutura (dimensionamento de carga, distribuição de carga, estratégias para cache, etc.);
4. Ser responsável por monitoramento e observabilidade dentro dos clusters e parcialmente nas aplicações também (uso de recursos das máquinas, gargalos de desempenho, análises preditivas de custo, etc.);
5. Estar em rotação on-call para raros incidentes de indisponibilidade ou manipulação de serviço;
6. Identificar e ajudar a solucionar problemas de desempenho e segurança;
7. Identificar oportunidades de melhorias e realizar a implementação de automatizações;
8. Elevar o nível dos sistemas de forma sustentável, por mecanismos de automação, soluções para que se tornem performáticos, escaláveis e disponíveis;
9. Disseminar conhecimento sobre as melhores práticas do SRE;
10. Planejar e direcionar a mudança de cultura através da Reabilidade do Sistema, incluindo: uso de padrões de arquitetura, gerenciamento de capacidade, sobre estrutura de nuvem utilizada pelos desenvolvedores;
11. Zelar pela manutenção dos serviços produtivos, medindo e monitorando a disponibilidade, latência e integridade geral do sistema;
12. Se envolver no desenvolvimento de seus pares em um ambiente de aprendizagem colaborativa (trabalho em par, revisão de código, palestras internas, etc).

Requisitos:

1. Conhecimento avançados em Docker e Kubernetes;
2. Conhecimento em orquestração de containers OnPremise e AWS (EKS);
3. Conhecimento em ferramentas de observabilidade (Grafana, Prometheus, Zabbix);
4. Conhecimento na solução de Observabilidade Dynatrace APM (Desejável);
5. Conhecimento em gestão de logs (Splunk, ELK);
6. Conhecimento em ferramentas de mensageria (Kafka) - Desejável;
7. Conhecimento em boas práticas de versionamento (Git, Gitflow, Conventional commits) e GitOps;
8. Conhecimento em sistema operacional Linux (segurança, troubleshoot, coleta de métricas e análise de performance);
9. Conhecimento em sistema Windows server;
10. Conhecimento em Cloud AWS no escopo dos serviços relacionados a SRE e Monitoramento;
11. Conhecimento em Cloud AWS (S3, EC2, VPC, ECS, EKS, IAM, etc);
12. Conhecimento em CI/CD (Jenkins e Azure DevOps);
13. Conhecimento em ferramentas da cultura DevOps (Infraestrutura como código, CI/CD, CloudFormation, Terraform);
14. Conhecimento em Web servers (Apache, Nginx, IIS);
15. Conhecimento em troubleshoot em aplicações Java, C#, Python, Javascript (Desejável);
16. Conhecimento em scripting (Shell/Bash, Python);
17. Conhecimento em rede (firewall, roteamento e troubleshoot, DNS);
18. Conhecimento em processos ágeis;
19. Possui inglês avançado.

Diferenciais: Remoto

Por que construir sua carreira na Meta?

Oferecemos autonomia, metas claras e um ambiente dinâmico e desafiador, onde os profissionais têm oportunidade de interagir com diferentes tecnologias, participar de todos os tipos de projetos, trazer novas ideias e trabalhar de qualquer lugar do Brasil e (por que não?) do mundo. Além disso, somos uma das melhores empresas para se trabalhar no Brasil segundo o Great Place to Work e uma das 10 empresas que mais crescem no país há 3 anos consecutivos, segundo o Anuário Informática Hoje.

Quais são nossos valores?

1. Somos pessoas servindo pessoas;
2. Pensamos e agimos como donos;
3. Temos gana por performance;
4. Crescemos e aprendemos juntos;
5. Buscamos excelência e a simplicidade;
6. Temos inovação e criatividade no nosso DNA.

Todas as pessoas são bem-vindas independentemente de sua condição, deficiência, etnia, crença religiosa, orientação sexual, aparência, idade ou afins. Queremos que você cresça conosco em um ambiente acolhedor e repleto de oportunidades.

Se identificou? Então, #VemSerMeta!

#J-18808-Ljbffr

Se candidatar

Criar um alerta

Salvar