🤖 Machine Learning
Modelos supervisionados e ensemble com validação cruzada e ROC-AUC/F1.
Python · Scikit-learn
📊 Churn Prediction
Pipeline end-to-end com feature engineering, tuning e interpretação SHAP.
Python · XGBoost · SHAP
🎬 MovieLens 33M
Análise e otimização de 33M registos em arquitetura escalável.
DuckDB · Polars · AWS S3
⚡ Apache Spark
Processamento distribuído e data pipelines em ambiente Big Data.
PySpark · Databricks
🗄️ SQL Analytics (Auction/Lojas)
Queries avançadas e modelação relacional para análise transacional.
SQL · MySQL · SQL Server
📈 Power BI & Fabric
Dashboards com DAX e automatização de fluxos em Data Lake empresarial.
Microsoft Fabric · Power BI · DAX
📐 Estatística Aplicada
Testes de hipóteses, regressão e inferência para suporte à decisão.
R · Python