Skip to content

IncomeView/kaggle_intermediateMachineLearning

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation


📘 Kaggle Intermediate Machine Learning (Estudo + Companion Book)

Repositório oficial de estudos, notebooks e livro complementar do curso Kaggle Intermediate Machine Learning

Bem‑vindo ao repositório que documenta todo o processo de estudo, prática e produção teórica do curso Kaggle Intermediate Machine Learning.
Aqui você encontra:

  • 📚 Companion Book — um livro completo explicando o raciocínio por trás do curso
  • 🧪 Notebooks práticos — exercícios, experimentos e pipelines
  • 🧠 Processo de estudo estruturado
  • 🏗️ Padrão editorial para criação de novos livros
  • 📂 Organização profissional de projeto de Machine Learning

Este repositório foi construído para ser portfólio, material de referência e base de estudos contínuos.



🧭 Objetivo do Repositório

Este repositório consolida:

  • o aprendizado do curso Kaggle Intermediate ML
  • o Companion Book criado durante o estudo
  • os notebooks de prática
  • a documentação teórica aprofundada
  • o processo editorial para novos livros técnicos

O foco é entender profundamente o raciocínio do Kaggle, não apenas executar código.



📚 Companion Book — “Machine Learning Intermediário: Guia Prático e Comentado”

O livro acompanha o curso e explica:

  • o porquê de cada decisão
  • o raciocínio por trás das técnicas
  • suposições implícitas do Kaggle
  • comparações entre abordagens
  • erros comuns e boas práticas
  • glossários e checklists

Cada capítulo segue um padrão editorial profissional, incluindo:

  • Introdução
  • Revisão do fluxo anterior
  • Problema central
  • Conceito teórico
  • Exemplos com código
  • Comparações
  • Erros comuns
  • Boas práticas
  • Mini‑casos reais
  • Checklist
  • Glossário
  • Conclusão

O Companion Book está disponível em:

docs/intermediateMachineLearning_book.md



🧪 Notebooks do Estudo

Os notebooks seguem a sequência do curso:

notebooks/
  01_introduction.ipynb
  02_missing_values.ipynb
  03_categorical_variables.ipynb
  04_pipelines.ipynb
  05_cross_validation.ipynb
  06_xgboost.ipynb
  07_data_leakage.ipynb

Cada notebook contém:

  • execução prática
  • experimentos controlados
  • comparação de abordagens
  • validação com MAE
  • integração com pipelines



🏗️ Estrutura do Projeto

ml/
└── kaggle/
    └── intermediate-ml/
        ├── data/
        │   ├── raw/          # dados originais (não versionados)
        │   └── processed/    # dados transformados
        ├── notebooks/        # prática e experimentos
        ├── models/           # modelos treinados
        ├── outputs/          # gráficos, métricas, artefatos
        ├── scripts/          # utilitários e funções auxiliares
        ├── docs/             # Companion Book e documentação
        ├── config.py         # configurações do projeto
        ├── requirements.txt  # dependências
        └── README.md         # este arquivo



🧠 Processo de Estudo

O estudo segue um fluxo estruturado:

  1. Ler o capítulo do Companion Book
  2. Executar o notebook correspondente
  3. Comparar abordagens usando MAE
  4. Documentar aprendizados no livro
  5. Refinar o entendimento com novos experimentos
  6. Atualizar o repositório com commits claros

Esse processo garante:

  • profundidade teórica
  • prática consistente
  • documentação contínua
  • evolução do conhecimento



✍️ Padrão Editorial para Novos Livros e Capítulos

Todo novo conteúdo técnico segue o PROMPT MESTRE, que define:

  • estrutura obrigatória
  • tom técnico e didático
  • uso de código conceitual
  • quadros de destaque
  • diagramas simples
  • glossário
  • checklist
  • conexão entre capítulos
  • alinhamento com o curso original

Esse padrão garante consistência e qualidade profissional.



🧩 Tecnologias Utilizadas

  • Python
  • Pandas
  • Scikit‑Learn
  • XGBoost
  • Jupyter Notebook
  • Pipelines e ColumnTransformer
  • RandomForestRegressor
  • MAE (Mean Absolute Error)



🧪 Como Reproduzir o Ambiente

Instale as dependências:

pip install -r requirements.txt

Execute os notebooks:

jupyter notebook



🧵 Contribuição e Evolução

Este repositório é vivo.
A cada novo estudo, capítulo ou curso, novos conteúdos serão adicionados seguindo o padrão editorial.



🏁 Status Atual do Projeto

✔ Companion Book — capítulos 1 a 4 concluídos
✔ Notebooks — sequência completa criada
✔ Estrutura do projeto — organizada
✔ Padrão editorial — definido



🚀 Próximos Passos

  • Criar capítulos 5, 6 e 7 do Companion Book
  • Iniciar o próximo livro da trilha de Machine Learning
  • Expandir o repositório com novos cursos Kaggle
  • Criar materiais avançados (Feature Engineering, ML Avançado, etc.)



🤝 Autor

Moacir
Estudo contínuo em Machine Learning, Data Science e Engenharia de Dados.
Este repositório documenta sua jornada técnica e serve como portfólio profissional.



About

Practical Kaggle course covering intermediate machine learning techniques, including data preprocessing, pipelines, cross‑validation, model improvement, and XGBoost.

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors