O que precisamos que você tenha de conhecimento:Requisitos essenciais: Tecnologias: Docker, ArgoCD, Kubernets, Jenkins, OpenShift, Prometheus, Git/Gitlab e IBM Cloud Apache Nifi, Hadoop, Airflow, Terraform, Bash Python (Flask, Pandas, Scikit-Learn, Pytorch, Tensorflow), R e Spark; Bancos: Relacionais: Postgre, Oracle, Mysql, DB2 e HIVE Não relacionais: MongoDB Vetorial: Milvus BERT, Word2Vec, Doc2Vec, TF-IDF, FastText, SBERT, BERTopic, LDA, entre outros modelos e técnicas para NLP; Modelos de Regressão Logística e Linear, GBM, XGBoost, LightGBM, SVM Machine Learning (Regressão, classificação, clusterização) Deep Learning, Séries Temporais. Mensageria (Kafka) Bibliotecas como: Seaborn, pandas, Flask, Matplotlib, PdfToText, Re, Pandarallel, PyTorch, Sentence Transformers.O que esperamos que você realize:Como Cientista de Dados Pleno, você será responsável por construir e otimizar pipelines de dados utilizando tecnologias como Docker, Kubernetes e Apache Nifi. Sua atuação incluirá a modelagem e análise de dados com Python, R e Spark, além de desenvolver soluções em machine learning e deep learning para problemas de regressão, classificação e séries temporais. Você também implementará e monitorará soluções em ambientes de nuvem, como IBM Cloud, e trabalhará com uma variedade de bancos de dados e ferramentas de mensageria, como Kafka.