Estamos em busca de um Cientista de Dados Sênior com sólida experiência em engenharia e análise de dados, capaz de atuar end-to-end em projetos de modelagem preditiva e análise de anomalias. O profissional será responsável pelo desenvolvimento de soluções utilizando machine learning, estatística avançada e visão computacional, garantindo a eficiência na modelagem e operacionalização de modelos de IA. Além da construção de modelos preditivos, o profissional deverá ter expertise em ETL, pipelines de dados, análise descritiva, diagnóstica e preditiva, bem como experiência no desenvolvimento de APIs utilizando FastAPI e Flask para disponibilizar modelos e insights de forma escalável. Conhecimento em BI e visualização de dados será um diferencial.
Responsabilidades • Modelagem Preditiva e Séries Temporais: Desenvolver modelos estatísticos e de machine learning para previsão de demanda, consumo, preços, falhas, entre outras aplicações.
• Análise de Anomalias: Criar modelos para identificação de padrões e detecção de anomalias em grandes volumes de dados.
• Visão Computacional: Desenvolver soluções baseadas em redes neurais, CNNs e técnicas de deep learning para extração de insights a partir de imagens e vídeos.
• Construção de Pipelines e ETL: Projetar, desenvolver e otimizar pipelines escaláveis de dados para ingestão, processamento e transformação eficiente de grandes volumes de dados.
• Engenharia de Features: Criar e otimizar features relevantes para alimentar modelos preditivos de alta performance.
• Levantamento de APIs para Modelos de IA: Construir e disponibilizar modelos preditivos e análises de dados via APIs utilizando FastAPI e Flask.
• Integração com Ambientes de Produção: Trabalhar em conjunto com engenheiros de dados e arquitetos para operacionalizar modelos e criar pipelines escaláveis.
• Acompanhamento e Monitoramento: Definir métricas de sucesso, monitorar modelos em produção e realizar ajustes conforme necessário.
• Colaboração com Stakeholders: Trabalhar junto a times de negócios, engenharia e produto para traduzir desafios operacionais em soluções de dados.
Experiência desejada: • Sólida experiência em modelagem preditiva, com foco em séries temporais, machine learning supervisionado e não supervisionado.
• Experiência avançada com estatística, aprendizado de máquina, redes neurais e visão computacional.
• Conhecimento em engenharia de dados, incluindo construção de pipelines de ETL, otimização de queries e automação de processos de ingestão e transformação de dados.
• Experiência no desenvolvimento de APIs escaláveis para servir modelos de machine learning e análises de dados usando FastAPI e Flask.
• Capacidade de trabalhar com grandes volumes de dados, garantindo qualidade e confiabilidade. • Experiência com ferramentas de BI e visualização de dados (Power BI, Tableau, Looker) será um diferencial.
• Forte perfil analítico e investigativo, com habilidades para análise descritiva, diagnóstica e preditiva.
• Experiência com deploy e monitoramento de modelos de machine learning em produção.
Requisitos Técnicos • Linguagens: Python (Pandas, NumPy, Scikit-Learn, TensorFlow, PyTorch), SQL.
• Banco de Dados: PostgreSQL, BigQuery, Snowflake, Redshift, MySQL.
• Machine Learning & Estatística: Séries Temporais (ARIMA, Prophet, LSTMs), Modelos Supervisionados (XGBoost, LightGBM, Random Forest), Modelos Não Supervisionados (DBSCAN, Isolation Forest).
Vaga 100% Remota Modelo: PJ