Site reliability engineer ii

Curitiba

Meta

Anunciada dia 2 março

Descrição

O que procuramos?
Atribuições principais:
Prover guia técnico e mentor técnico outros engenheiros;
Participar do desenvolvimento e manutenção da infraestrutura Cloud;
Colaborar nas decisões técnicas envolvendo arquitetura e infraestrutura (dimensionamento de carga, distribuição de carga, estratégias para cache, etc.);
Ser responsável por monitoramento e observabilidade dentro dos clusters e parcialmente nas aplicações também (uso de recursos das máquinas, gargalos de desempenho, análises preditivas de custo, etc.);
Estar em rotação on-call para raros incidentes de indisponibilidade ou manipulação de serviço;
Identificar e ajudar a solucionar problemas de desempenho e segurança;
Identificar oportunidades de melhorias e realizar a implementação de automatizações;
Elevar o nível dos sistemas de forma sustentável, por mecanismos de automação, soluções para que se tornem performáticos, escaláveis e disponíveis;
Disseminar conhecimento sobre as melhores práticas do SRE;
Planejar e direcionar a mudança de cultura através da Reabilidade do Sistema, incluindo: uso de padrões de arquitetura, gerenciamento de capacidade, sobre estrutura de nuvem utilizada pelos desenvolvedores;
Zelar pela manutenção dos serviços produtivos, medindo e monitorando a disponibilidade, latência e integridade geral do sistema;
Se envolver no desenvolvimento de seus pares em um ambiente de aprendizagem colaborativa (trabalho em par, revisão de código, palestras internas, etc).
Requisitos:
Conhecimento avançado em Docker e Kubernetes.
Conhecimento em orquestração de containers OnPremise e AWS (EKS);
Conhecimento em ferramentas de observabilidade (Grafana, Prometheus, Zabbix);
Conhecimento na solução de Observabilidade Dynatrace APM (Desejável);
Conhecimento em gestão de logs (Splunk, ELK);
Conhecimento em ferramentas de mensageria (Kafka) - Desejável;
Conhecimento em boas práticas de versionamento (Git, Gitflow, Conventional commits) e GitOps;
Conhecimento em sistema operacional Linux (segurança, troubleshoot, coleta de métricas e análise de performance).
Conhecimento em sistema Windows server;
Conhecimento em Cloud AWS no escopo dos serviços relacionados a SRE e Monitoramento;
Conhecimento em Cloud AWS (S3, EC2, VPC, ECS, EKS, IAM, etc).
Conhecimento em CI/CD (Jenkins e Azure DevOps).
Conhecimento em ferramentas da cultura DevOps (Infraestrutura como código, CI/CD, CloudFormation, Terraform);
Conhecimento em Web servers (Apache, Nginx, IIS);
Conhecimento em troubleshoot em aplicações Java, C#, Python, Javascript (Desejável);
Conhecimento em scripting (Shell/Bash, Python).
Conhecimento em rede (firewall, roteamento e troubleshoot, DNS).
Conhecimento em processos ágeis;
Possui inglês avançado.
Diferenciais: Remoto
Por que construir sua carreira na Meta?
Oferecemos autonomia, metas claras e um ambiente dinâmico e desafiador, onde os profissionais têm oportunidade de interagir com diferentes tecnologias, participar de todos os tipos de projetos, trazer novas ideias e trabalhar de qualquer lugar do Brasil e (por que não?) do mundo. Além disso, somos uma das melhores empresas para se trabalhar no Brasil segundo o Great Place to Work e uma das 10 empresas que mais crescem no país há 3 anos consecutivos, segundo o Anuário Informática Hoje.
Quais são nossos valores?
Somos pessoas servindo pessoas;
Pensamos e agimos como donos;
Temos gana por performance;
Crescemos e aprendemos juntos;
Buscamos excelência e a simplicidade;
Temos inovação e criatividade no nosso DNA.
Todas as pessoas são bem-vindas independentemente de sua condição, deficiência, etnia, crença religiosa, orientação sexual, aparência, idade ou afins. Queremos que você cresça conosco em um ambiente acolhedor e repleto de oportunidades.
Se identificou? Então, #VemSerMeta!#J-18808-Ljbffr

Se candidatar

Criar um alerta

Salvar

Vaga parecida

Analista de gestão de metas e indicadores pleno

Curitiba

EWAVE DO BRASIL

€ 5.000 - € 8.000 por mês