Somos uma empresa 100% digital, com tecnologia desenvolvida localmente e líder no mercado de compra e venda online. Nos tornamos a marca que melhor representa a economia circular no país.Hoje contamos com dois escritórios nas cidades de Rio de Janeiro e São Paulo. Nosso modelo de trabalho flexível oferece autonomia e liberdade para que nossas pessoas elaborem seus padrões e rotinas com disciplina e protagonismo na conexão com negócio, as prioridades e o propósito da empresa.Construir um ambiente diverso, inclusivo e comprometido com a equidade faz parte do nosso DNA. Entendemos que diversidade, equidade e inclusão são essenciais para criarmos um ambiente seguro com entregas inovadoras e eficientes para nossas pessoas e sociedade.Se você gosta de aprender e quer fazer parte desse desafio, essa oportunidade é a sua chance. Nessa posição de Staff Software Engineer, você vai somar ao time Observabilidade, FinOps e DevTools, que tem como objetivo capacitar a empresa com plataformas eficientes, sustentáveis e escaláveis, garantindo visibilidade total dos sistemas, produtividade dos times de engenharia e otimização financeira da nuvem, alinhando tecnologia e negócios para entregar valor com eficiência e controle.Estamos em busca de uma pessoa para liderar e sustentar a estratégia de monitoramento, métricas, logs e rastreamento distribuído em nossa infraestrutura. O profissional será responsável pela manutenção e evolução de uma stack open-source (Grafana, Prometheus, ElasticSearch) e plataformas SaaS, como Datadog, garantindo alta disponibilidade, performance e confiabilidade dos serviços.Este papel exige expertise em Kubernetes (K8s), Cloud Computing (AWS, Azure ou GCP), além de um profundo conhecimento sobre componentes de nuvem e gestão de sistemas distribuídos. O Staff de Observabilidade atuará em colaboração com times de engenharia, DevTools e FinOps para garantir visibilidade e controle total sobre os sistemas.No dia a dia você vai:Garantir a disponibilidade, escalabilidade e eficiência da stack de observabilidade baseada em Grafana, Prometheus e ElasticSearch.Monitorar e otimizar a plataforma Datadog, garantindo sua melhor utilização e evitando desperdícios de recursos.Criar e manter dashboards e alertas eficientes para observabilidade e monitoramento de aplicações e infraestrutura.Definir e implementar políticas de retenção, agregação e compressão de logs, otimizando custos e performance.Desenvolver e manter pipelines de monitoramento para ingestão, processamento e análise de métricas e logs.Criar mecanismos de auto-remediação baseados em eventos e anomalias detectadas.Automatizar processos de deploy, configuração e tuning das ferramentas de observabilidade.Analisar tendências de comportamento do sistema e antecipar problemas antes que impactem o negócio.Implementar tracing distribuído para garantir visibilidade ponta a ponta em aplicações distribuídas e microservices.Trabalhar junto aos times de engenharia para melhorar performance de aplicações e bancos de dados através de insights baseados em métricas.Assegurar que os logs e métricas estejam seguros e em conformidade com políticas de privacidade e segurança da informação.Implementar controles de acesso e políticas de segurança para observabilidade, garantindo que apenas stakeholders autorizados tenham acesso a dados críticos.Atuar como referência técnica para os times de engenharia, promovendo boas práticas de observabilidade.Conduzir treinamentos e workshops para educar desenvolvedores sobre como utilizar as ferramentas e interpretar dados de monitoramento.Criar documentações e guias sobre boas práticas de instrumentação de código, logs estruturados e métricas relevantes.E o que você precisa ter?Forte experiência com observabilidade em ambientes Cloud e Kubernetes (K8s).Proficiência em Prometheus, Grafana, ElasticSearch e Datadog.Experiência prática com Tracing Distribuído (OpenTelemetry, Jaeger, Zipkin).Conhecimento avançado em arquiteturas distribuídas e troubleshooting de sistemas complexos.Sólidos conhecimentos sobre componentes de Cloud (AWS, Azure ou GCP) e suas métricas nativas.Experiência em infraestrutura como código (Terraform, Helm, Ansible).Habilidade para diagnosticar problemas de performance em aplicações, containers e bancos de dados.Experiência com integração de observabilidade em pipelines CI/CD.Conhecimento em FinOps para otimização de custos em monitoramento.Background em engenharia de software ou SRE, garantindo entendimento profundo das necessidades dos times técnicos.Perfil de liderança técnica, com habilidade para orientar e apoiar times multidisciplinares.Mentalidade analítica e investigativa, com forte capacidade de resolução de problemas.Boa comunicação e didática, para compartilhar conhecimento e influenciar mudanças organizacionais.Capacidade de priorização e autonomia, atuando de forma proativa na identificação de melhorias e resolução de incidentes.Mais sobre o Grupo OLX:No Brasil desde 2010, o Grupo OLX tem como propósito empoderar as pessoas para que alcancem seus sonhos, reinventando o modelo de consumo. Com a aquisição do Grupo ZAP, concluída em outubro de 2020, a companhia opera a OLX, plataforma horizontal com posição de liderança nas categorias de automóveis, bens de consumo usados e imóveis; e duas plataformas líderes do mercado imobiliário, ZAP e Viva Real.Remuneração compatível com o mercadoPlano de SaúdePrevidência PrivadaBenefícios flexíveis que se adaptam às suas necessidadesAuxílio alimentaçãoAconselhamento financeiroAuxílio Home OfficeAuxílio MobilidadeAuxílio CriançaLicenças estendidasIncentivo ao esporte, qualidade de vida e bem estarEmpréstimo consignado com taxas reduzidasCandidate-se e venha fazer parte dessa transformação conosco!
#J-18808-Ljbffr