Impactar positivamente bilhões de vidas é nosso propósito e também pode ser o seu.
Fundamentos
A Semantix foi fundada em 2010, no Brasil, e é referência em Big Data, Analytics e Inteligência Artificial.
Nosso time é composto por pessoas apaixonadas por inovação, com diferentes origens e graus de experiência. O que nos une é a motivação compartilhada de transformar a experiência de nossos clientes através da cultura data driven.
Se você se identificou com esses valores, a Semantix é seu lugar.
Descrição do Cargo
Buscamos um Cientista de Dados para atuar no desenvolvimento de uma Prova de Conceito (POC) voltada para otimização do Ciclo de Receita por meio de Inteligência Artificial e Modelos Preditivos.
O profissional será responsável pela construção e produtização de um modelo de detecção de anomalias, explorando dados de faturamento, crédito, arrecadação e cobrança para identificar padrões e apoiar a tomada de decisão estratégica.
Responsabilidades
* Mapeamento e análise exploratória de dados, compreendendo o negócio e identificando variáveis-chave.
* Construção, avaliação e refinamento de modelos preditivos e de detecção de anomalias.
* Implementação de pipelines de Machine Learning para automação do ciclo de vida do modelo.
* Produtização do modelo, garantindo eficiência e escalabilidade.
* Monitoramento da performance do modelo em produção, aplicando técnicas de reentrenamento e validação contínua.
* Validação e apresentação dos resultados para stakeholders, incluindo documentação técnica e funcional.
* Integração com ferramentas e plataformas da Vivo, garantindo compatibilidade com o ecossistema atual.
* Colaboração com equipes multidisciplinares, incluindo engenheiros de dados e analistas de negócios.
Requisitos
* Experiência com modelagem preditiva e detecção de anomalias em cenários de alta volumetria.
* Domínio de Machine Learning e Inteligência Artificial, incluindo bibliotecas como Scikit-Learn, TensorFlow ou PyTorch.
* Experiência com MLOps, incluindo:
o Versionamento e tracking de modelos (MLflow, DVC).
o Automação de pipelines de machine learning (Kubeflow, Airflow).
o Monitoramento de modelos em produção (Prometheus, Grafana).
o Deploy de modelos usando APIs e contêineres (Docker, Kubernetes, FastAPI, Flask).
* Conhecimento avançado em SQL e manipulação de grandes bases de dados (Oracle, MSSQL, Teradata, Hadoop).
* Experiência com processamento de dados em escala (PySpark, Pandas, Dask).
* Domínio de técnicas estatísticas e matemáticas aplicadas à análise de dados e previsões.
* Familiaridade com ferramentas de visualização de dados (Power BI, Tableau, Matplotlib, Seaborn).
* Experiência em ambientes cloud (AWS, GCP ou Azure).
* Versionamento de código com Git e boas práticas de engenharia de software.
Qualificações Desejáveis
* Pós-graduação ou certificações em Ciência de Dados, Machine Learning ou áreas correlatas.
* Experiência com projetos de dados em Telecom ou setores de alta volumetria de clientes.
* Experiência com modelagem para IA conversacional.
* Conhecimento em SAS e plataformas de analytics empresariais.
Diferenciais
* Experiência com engenharia de features e otimização de modelos para produção.
* Background em finanças, cobrança ou pricing.
* Capacidade de comunicação para traduzir insights técnicos para times de negócio.