Responsabilidades e atribuições:
Atuar como principal contato técnico para equipes e clientes internos, abordando e solucionando problemas de suporte e solicitações técnicas relacionadas a sistemas de produção.
Conduzir análises técnicas aprofundadas de incidentes, realizando investigações de causa raiz e colaborando com equipes de engenharia para propor e implementar soluções.
Monitorar, relatar e solucionar problemas de pipeline de dados e sistemas de back-end, aplicando soluções alternativas ou correções conforme necessário para garantir a operação contínua.
Colaborar com equipes de Engenharia e SRE (Engenharia de Confiabilidade do Site) para aprimorar os processos de Gerenciamento de Incidentes e Gerenciamento de Problemas para uma resolução de problemas mais eficaz.
Trabalhar em estreita colaboração com gerentes de projeto e equipes de operações para garantir uma comunicação tranquila, progressão de projetos em andamento no prazo e correções de produção.
Analisar fluxos de trabalho e criar relatórios de defeitos / falhas detalhados, acompanhando os problemas até a resolução e garantindo o acompanhamento e o encerramento adequados.
Requisitos e qualificações:
Proficiência em depuração de problemas técnicos em ambientes de produção de alto volume e de ritmo acelerado.
Proficiente em SQL e familiarizado com ecossistemas de Big Data como Cassandra, Flink, Kafka e outras tecnologias relacionadas.
Forte conhecimento de scripts com Python ou linguagens similares para automatizar tarefas e solucionar problemas de forma eficiente.
Experiência em depuração de API Requests e problemas de respostas usando ferramentas como Charles, logs de rede ou métodos semelhantes para resolver incidentes de produção.
Experiência com implementação e administração de ferramentas de monitoramento, registro e telemetria (por exemplo, Splunk, Prometheus, etc.) para manter a integridade da produção.
Familiaridade com sistemas de controle de versão como Git e conhecimento das melhores práticas de programação.
Conhecimento de ferramentas e fluxos de trabalho de gerenciamento de incidentes, bem como experiência com análise de causa raiz em ambientes de produção.
Ingles avançado para escrita e conversação (obrigatório, pois a equipe é global, com a maior parte alocada fora do Brasil).