O Cidacs conduz estudos e pesquisas baseados em projetos interdisciplinares originados na vinculação de grandes volumes de dados para ampliar o entendimento dos determinantes e das políticas sociais e ambientais sobre a saúde da população.
/n O QUE VOCÊ PRECISA CONHECER PARA SE CANDIDATAR: Formação superior em Ciência da Computação, Engenharia de Computação, Sistemas de Informação ou áreas correlatas; Possuir título de mestre e/ou doutor nas áereas de formação superior indicadas acima; Mínimo de 2 anos de experiência em arquitetura de dados e gestão de bancos de dados em grande escala; Conhecimento avançado em modelagem de dados e bancos de dados relacionais (SQL) e não relacionais (NoSQL); Experiência em arquiteturas de dados distribuídas e escaláveis, especialmente em ambientes de Big Data (ex.
: Apache Spark, ElasticSearch); Experiência em projetar e otimizar data lakes e data lakehouse (ex.
: MinIO, Delta Lake); Conhecimento de otimização de grandes volumes de dados em arquiteturas distribuídas, utilizando motores de consulta(ex.
: Trino, Presto); Experiência em integração e transformação de dados em larga escala, incluindo processos ETL/ELT; Conhecimento em automação de pipelines de dados usando orquestradores como Apache Airflow; Experiência com controle de versão (Git) e práticas de CI/CD para desenvolvimento e implementação de pipelines de dados; Experiência avançada em ambientes Linux e scripting (ex.
: Bash, Python); Capacidade de colaborar com times multidisciplinares, incluindo cientistas de dados e analistas de dados; Nível de inglês para interação grupos de pesquisa internacionais, leitura e escrita de documentação e artigos.
CONSIDERAMOS ESTES REQUISITOS COMO DIFERENCIAIS: Experiência com dados de saúde pública e estudos epidemiológicos com o de coortes; Publicações nas áreas de computação aplicadas à saúde; Conhecimento em otimização de queries e design de esquemas para bancos de dados voltados para alta performance; Experiência com bancos de dados orientados a colunas (ex.
: Cassandra, HBase) e motores de consulta distribuídos (ex.
: Trino, Presto); Familiaridade com governança de dados e frameworks de boas práticas (ex.
: DMBOK); Conhecimento avançado em containers e orquestração de containers (ex.
: Docker, Kubernetes); Certificações em Big Data, bancos de dados ou arquitetura de dados; Inglês avançado, especialmente para manter conversaç!oes com grupos internacionais.
/n ESSAS SÃO AS PRINICPAIS RESPONSABILIDADES E ATRIBUIÇÕES: Colaborar com equipes multidisciplinares, internas e externas, incluindo cientistas de dados, epidemiologistas e analistas, traduzindo desafios científicos em soluções tecnológicas inovadoras; Desenvolver pesquisquisas em Ciência de Dados Populacional nas prioridades do Cidacs; Participar de reuniões e sessões técnicas para disseminar conhecimento e garantir a eficiência nas operações de dados; Apoiar iniciativas de modernização da arquitetura de dados, incorporando novas tecnologias e boas práticas para ambientes de Big Data; Projetar e otimizar bancos de dados estruturados (SQL) e não estruturados (NoSQL) para atender às demandas das pesquisas do Cidacs; Documentar arquiteturas, fluxos e estratégias de dados, assegurando a facilidade de manutenção e escalabilidade das soluções; Auxiliar na avaliação, implementação e otimização de data lakes e data lakehouses voltados para pesquisa em saúde; Desenvolver e gerenciar pipelines de dados utilizando ferramentas de processamento distribuído; Monitorar o desempenho e a escalabilidade da arquitetura de dados, identificando e solucionando gargalos de performance em ambientes distribuídos; Implementar estratégias de governança e segurança de dados, garantindo conformidade com diretrizes regulatórias; Auxiliar nas atividades de pré-processamento, vinculação de dados e construção de datasets para estudos epidemiológicos e análises avançadas; Colaborar com equipes multidisciplinares, incluindo cientistas de dados, epidemiologistas e analistas, traduzindo desafios científicos em soluções tecnológicas inovadoras; Elaborar e apresentar relatórios técnicos periódicos sobre a infraestrutura e processos de dados do Cidacs.