Foxbit | São Paulo – SP | Remoto (Berrini)
Descrição da Posição:
Estamos à procura de um SRE (Site Reliability Engineer) para nos ajudar a garantir a estabilidade, segurança e escalabilidade de uma das maiores exchanges de criptomoedas do Brasil!
O principal objetivo do time de SRE é, em conjunto com Desenvolvimento e Segurança, garantir a confiabilidade dos sistemas, monitorar, melhorar a performance e automatizar processos visando eficiência e estabilidade contínua.
Responsabilidades Principais: Garantir a confiabilidade, disponibilidade e performance dos sistemas, automatizando processos e implementando soluções escaláveis;Monitorar e gerenciar incidentes de Infra, garantindo a rápida resolução de problemas críticos, e criar ferramentas de automação para mitigar futuras ocorrências;Trabalhar em estreita colaboração com os times de Desenvolvimento e Infraestrutura para otimizar o ciclo de vida das aplicações desde a concepção até a operação;Monitorar e otimizar o uso de recursos na AWS, implementando práticas de custos eficientes;Criar dashboards e relatórios utilizando ferramentas como Grafana e Prometheus para visualização e acompanhamento de métricas;Contribuir para a melhoria contínua das práticas de DevOps e SRE, promovendo uma cultura de automação e feedback rápido.Requisitos: Experiência como engenheiro de software ou SRE, com foco em operações financeiras de alta disponibilidade;Proficiência em Kubernetes para orquestração de contêineres e gestão de clusters;Sólidos conhecimentos em AWS e seus principais serviços (EC2, RDS, S3, etc.
);Experiência com infraestrutura como código (IaC), especialmente utilizando Terraform;Experiência com monitoramento e observabilidade utilizando Prometheus, Grafana e outras ferramentas de métricas;Sólidos conhecimentos em automação de infraestrutura, CI/CD e práticas de DevOps;Experiência em troubleshooting e resolução de problemas complexos em ambientes de produção;Conhecimento de práticas de segurança e compliance em ambientes de cloud computing;Familiaridade com ferramentas de gerenciamento de logs como Grafana Loki;Experiência com Docker e criação de ambientes conteinerizados;Conhecimento em linguagens de scripting como Python, GoLang ou Bash;Experiência com ferramentas de CI/CD como GitHub Actions;Conhecimento em sistemas de fila e mensageria como RabbitMQ ou Kafka;Familiaridade com práticas de FinOps para otimização de custos em cloud computing;Conhecimento do mercado financeiro e/ou criptomoedas será um diferencial;Experiência com segurança da informação aplicada a operações (SecOps).
#J-18808-Ljbffr