Atividades do dia a dia:
* Realizar o atendimento de incidentes de Infraestrutura Cloud e aplicação. Com base na análise de Logs, Traces e Métricas das aplicações, utilizando ferramentas de Observabilidade;
* Realizar o troubleshooting e solução de incidentes de infraestrutura em Cloud (Azure), Microserviços, Nodes, PODS, EKS, Kubernets;
* Desenvolver automações para solução de incidentes em primeiro nível visando a redução dos tempos de solução (MTTR);
* Analisar a performance e falhas de aplicações, e identificar origem a de erros/falhas que possam afetar os produtos;
* Tratar incidentes envolvendo APIS e aplicações;
* Executar, validar e acompanhar a execução de esteira de mudanças;
* Criar e aperfeiçoar monitorias de aplicações e infraestrutura, definir thresholds e criar alertas;
* Criar e Executar Queries em bancos de dados.
Requisitos para a posição:
* Conhecimento em Ferramentas de Observabilidade, como Datadog, Grafana, Loki, Zabbix, Prometheus.
* Conhecimento intermediários em cloud e seus componentes (rede, vm, banco, etc) preferencialmente Azure;
* Conhecimento em ferramentas do linux como awk, sed e/ou grep;
* Conhecimentos de estruturas de APIS, Postman, Swagger, Insomnia, troubleshooting, leitura de logs, versionamento e segurança;
* Conhecimentos em Docker, Kubernetes, esteira CI/CD e Pipeline;
* Experiência em Gestão de incidentes de alto impacto, análise e troubleshooting em camadas de infraestrutura e aplicação;
* Conhecimento em protocolos TCP e HTTP e Fluência em Sistema Operacional Linux;
* Conhecimentos em Linguagem SQL.
Diferenciais:
* Conhecimento em scripts bash/shell;
* Conhecimento em uma linguagem de programação orientada a objetos (C#, kotlin, Java..);
* Experiência em mercados financeiros em meios de pagamentos e mensageria ISO 8583;
* Conhecimentos em Rotinas Batch, Control-M e Connect Direct.
Mais detalhes sobre a posição:
* Modelo hibrido em Alphaville/Barueri-SP;
* Horário das 18h00 ás 06h00 (12x36) e de sábado das 09h00 ás 19h00.