Responsabilidades e atribuições:
* Atuar como principal contato técnico para equipes e clientes internos, abordando e solucionando problemas de suporte e solicitações técnicas relacionadas a sistemas de produção.
* Conduzir análises técnicas aprofundadas de incidentes, realizando investigações de causa raiz e colaborando com equipes de engenharia para propor e implementar soluções.
* Monitorar, relatar e solucionar problemas de pipeline de dados e sistemas de back-end, aplicando soluções alternativas ou correções conforme necessário para garantir a operação contínua.
* Colaborar com equipes de Engenharia e SRE (Engenharia de Confiabilidade do Site) para aprimorar os processos de Gerenciamento de Incidentes e Gerenciamento de Problemas para uma resolução de problemas mais eficaz.
* Trabalhar em estreita colaboração com gerentes de projeto e equipes de operações para garantir uma comunicação tranquila, progressão de projetos em andamento no prazo e correções de produção.
* Analisar fluxos de trabalho e criar relatórios de defeitos / falhas detalhados, acompanhando os problemas até a resolução e garantindo o acompanhamento e o encerramento adequados.
Requisitos e qualificações:
* Proficiência em depuração de problemas técnicos em ambientes de produção de alto volume e de ritmo acelerado.
* Proficiente em SQL e familiarizado com ecossistemas de Big Data como Cassandra, Flink, Kafka e outras tecnologias relacionadas.
* Forte conhecimento de scripts com Python ou linguagens similares para automatizar tarefas e solucionar problemas de forma eficiente.
* Experiência em depuração de API Requests e problemas de respostas usando ferramentas como Charles, logs de rede ou métodos semelhantes para resolver incidentes de produção.
* Experiência com implementação e administração de ferramentas de monitoramento, registro e telemetria (por exemplo, Splunk, Prometheus, etc.) para manter a integridade da produção.
* Familiaridade com sistemas de controle de versão como Git e conhecimento das melhores práticas de programação.
* Conhecimento de ferramentas e fluxos de trabalho de gerenciamento de incidentes, bem como experiência com análise de causa raiz em ambientes de produção.
* Ingles avançado para escrita e conversação (obrigatório, pois a equipe é global, com a maior parte alocada fora do Brasil).