Repositório oficial de estudos, notebooks e livro complementar do curso Kaggle Intermediate Machine Learning
Bem‑vindo ao repositório que documenta todo o processo de estudo, prática e produção teórica do curso Kaggle Intermediate Machine Learning.
Aqui você encontra:
- 📚 Companion Book — um livro completo explicando o raciocínio por trás do curso
- 🧪 Notebooks práticos — exercícios, experimentos e pipelines
- 🧠 Processo de estudo estruturado
- 🏗️ Padrão editorial para criação de novos livros
- 📂 Organização profissional de projeto de Machine Learning
Este repositório foi construído para ser portfólio, material de referência e base de estudos contínuos.
Este repositório consolida:
- o aprendizado do curso Kaggle Intermediate ML
- o Companion Book criado durante o estudo
- os notebooks de prática
- a documentação teórica aprofundada
- o processo editorial para novos livros técnicos
O foco é entender profundamente o raciocínio do Kaggle, não apenas executar código.
O livro acompanha o curso e explica:
- o porquê de cada decisão
- o raciocínio por trás das técnicas
- suposições implícitas do Kaggle
- comparações entre abordagens
- erros comuns e boas práticas
- glossários e checklists
Cada capítulo segue um padrão editorial profissional, incluindo:
- Introdução
- Revisão do fluxo anterior
- Problema central
- Conceito teórico
- Exemplos com código
- Comparações
- Erros comuns
- Boas práticas
- Mini‑casos reais
- Checklist
- Glossário
- Conclusão
O Companion Book está disponível em:
docs/intermediateMachineLearning_book.md
Os notebooks seguem a sequência do curso:
notebooks/
01_introduction.ipynb
02_missing_values.ipynb
03_categorical_variables.ipynb
04_pipelines.ipynb
05_cross_validation.ipynb
06_xgboost.ipynb
07_data_leakage.ipynb
Cada notebook contém:
- execução prática
- experimentos controlados
- comparação de abordagens
- validação com MAE
- integração com pipelines
ml/
└── kaggle/
└── intermediate-ml/
├── data/
│ ├── raw/ # dados originais (não versionados)
│ └── processed/ # dados transformados
├── notebooks/ # prática e experimentos
├── models/ # modelos treinados
├── outputs/ # gráficos, métricas, artefatos
├── scripts/ # utilitários e funções auxiliares
├── docs/ # Companion Book e documentação
├── config.py # configurações do projeto
├── requirements.txt # dependências
└── README.md # este arquivo
O estudo segue um fluxo estruturado:
- Ler o capítulo do Companion Book
- Executar o notebook correspondente
- Comparar abordagens usando MAE
- Documentar aprendizados no livro
- Refinar o entendimento com novos experimentos
- Atualizar o repositório com commits claros
Esse processo garante:
- profundidade teórica
- prática consistente
- documentação contínua
- evolução do conhecimento
Todo novo conteúdo técnico segue o PROMPT MESTRE, que define:
- estrutura obrigatória
- tom técnico e didático
- uso de código conceitual
- quadros de destaque
- diagramas simples
- glossário
- checklist
- conexão entre capítulos
- alinhamento com o curso original
Esse padrão garante consistência e qualidade profissional.
- Python
- Pandas
- Scikit‑Learn
- XGBoost
- Jupyter Notebook
- Pipelines e ColumnTransformer
- RandomForestRegressor
- MAE (Mean Absolute Error)
Instale as dependências:
pip install -r requirements.txtExecute os notebooks:
jupyter notebookEste repositório é vivo.
A cada novo estudo, capítulo ou curso, novos conteúdos serão adicionados seguindo o padrão editorial.
✔ Companion Book — capítulos 1 a 4 concluídos
✔ Notebooks — sequência completa criada
✔ Estrutura do projeto — organizada
✔ Padrão editorial — definido
- Criar capítulos 5, 6 e 7 do Companion Book
- Iniciar o próximo livro da trilha de Machine Learning
- Expandir o repositório com novos cursos Kaggle
- Criar materiais avançados (Feature Engineering, ML Avançado, etc.)
Moacir
Estudo contínuo em Machine Learning, Data Science e Engenharia de Dados.
Este repositório documenta sua jornada técnica e serve como portfólio profissional.