Repositório do básico ao avançado para quem já sabe Python (Aqui para aprender do zero) e quer aplicar em dados — com trilha linear, trilhas por objetivo e entregáveis de portfólio (notebook por módulo).
- EDA completa (limpeza, joins, agregações, narrativa e evidências)
- Visualização: matplotlib, seaborn e plotly
- Performance: polars + pyarrow/parquet
- Consulta local com duckdb (sem “ensinar SQL” como trilha principal)
- ML baseline com scikit-learn (pipeline + métricas)
A lógica aqui é:
-
praticar → Notebooks
-
reforçar → Scripts
-
finalizar → Mini-Projeto
-
publicar → Potifólio
1- Aula (Notebook)
Vá em notebooks e pratique cada um até se familiarizar completamente (aproximadamente ficará em cada um entre 15 a 30 min cada).
2- Reforço (Script)
Rode a versão comentada em scripts para fixar sem depender de notebook.
3- Entregável (Portfólio)
Abra Entregável Portifólio e execute até o fim.
Ele gera evidências dentro do próprio módulo:
projetos/<módulo>/assets/(imagens/HTML)projetos/<módulo>/reports/(Markdown/JSON)projetos/<módulo>/outputs/(parquet/modelos)
4- Publicação (GitHub)
Faça commit das evidências e atualize o README do mini-projeto com 2–3 bullets:
- o que você fez
- 1–2 insights
- onde está a evidência (imagem/relatório)
- Modo acelerado (2 semanas): 1 módulo por dia útil + revisão no fim de semana
- Modo sustentável (4–6 semanas): 2 módulos por semana + 1 dia só para o entregável
- Modo portfólio (8 semanas): 1 módulo por semana, caprichando nos assets e no texto do README
-
Se travar, não pule: finalize o entregável com o dataset .
-
Depois, repita usando outro dataset.
- Setup do ambiente
- Roteiro de estudo
- Estrutura do repositório
- Roadmap linear
- Trilhas
- Progress tracker
- Portfólio
- Datasets
- Dicas para seu Git
1- Clone o repositório:
git clone https://github.com/fabiomarcolia/python-para-dados.git
cd python-para-dados2- Crie e ative o ambiente virtual:
python -m venv .venv
# Windows:
.venv\Scripts\activate
# Linux/Mac:
source .venv/bin/activate3- Instale dependências:
pip install -r requirements.txt4- Abra no VS Code e rode os notebooks:
notebooks/(aulas)projetos/<módulo>/01_entregavel_portfolio.ipynb(entregável de portfólio)
1_setup/a9_machine_learning/(linha do Zero ao avançado)notebooks/aulas com explicação + prática (15–30 min)scripts/versões.pycomentadas (para rodar sem notebook)projetos/mini-projetos por módulo + entregáveis de portfóliotemplates/checklist e templates (EDA e README)dados/sample/dataset pequeno (sempre roda)source/datasets reais (opcional)
Veja a sequência completa em: ROADMAP.md
- Trilha EDA: pandas → visualização → EDA avançado
- Trilha Performance: polars → pyarrow/parquet → EDA avançado
- Trilha ML: EDA avançado → scikit-learn (baseline)
Use o índice de portfólio para acompanhar entregáveis por módulo:
O repo foi pensado para você gerar evidências “publicáveis” no GitHub:
- Cada módulo tem um notebook entregável:
projetos/<módulo>/01_entregavel_portfolio.ipynb
- Evidências geradas ficam em:
projetos/<módulo>/assets/(imagens/HTML)projetos/<módulo>/reports/(Markdown/JSON)projetos/<módulo>/outputs/(parquet/modelos)
Dica: use o projeto final (pasta projetos/10_projeto_final_end_to_end/) como peça principal e os mini-projetos como evidência incremental.
Dataset real sugerido (opcional) via submodule:
git submodule add https://github.com/fabiomarcolia/bases-dados-analytics-powerbi-ml dados/source/bases-dados-analytics-powerbi-mlSe você não adicionar o submodule, tudo roda com os arquivos em dados/bases_treino/.
- Use os projetos aqui como referência.
- Use o modelo de estrutura para criar projetos para seu portifólio.
- Coloque uma imagem para o repositório > Settings → Social preview '(imagem 1280×640)
- Crie sua apresentação com um README do seu perfil
Este repositório serve como uma mentoria guiada para aprender Python para dados. Seu aprendizado pode abrir uma janela de oportunidades, atualmente python é usa em várias funções e tecnologia: IA, Data Engineer, Data Analytics, Data Science entre outras.
Para mais conteúdo de Python, Carreira em Dados e IA, ou se quiser falar comigo sobre dúvidas, sugestões ou feedback:
- Linkedin: Vamos nos conectar e me envie uma mensagem🤝
- Mais Recursos de Carreira: Veja aqui
Agradeço seu apoio e fique a vontade de entrar em contato comigo!