Skip to content

raffOps/EduCensoExplorer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

43 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

EduCensoExplorer

ETL e visualização do Censo escolar. Link para o data app no Streamlit Community Cloud

Projeto elaborado para o meu TCC: "Uma proposta de extração, transformação, carga e visualização para os dados do Censo Escolar".

Link para o texto

Link para os slides

Visão geral

Ferramentas utilizadas: Python "puro" para ETL, Parquet para armazenamento de dados, DuckDB para consulta de dados e Streamlit para criação do Data App que resume graficamente os dados extraídos.

Todo o projeto utiliza pacotes Python e, devido a isso, o setup do projeto é feito utilizando Virtualenv.

ETL

  • A Execução do scripts Python é local e realizada pelo usuário
  • A carga é total devido a periodicidade do dado ser anual
  • Armazenamento dos dados em formato Parquet que são upados para o Github com o objetivo de facilitar a replicação do projeto e possibilitar o deploy gratuitamente no Streamlit Community Cloud.

ETL

APP

  • Aplicativo Web low-code utilizando Streamlit
  • Utiliza os dados armazenados em Parquet através de uma interface de consulta construida com DuckDB

App

Setup

  • Instale Python 3.10
  • Crie um ambiente virtual para o seu Python. Aqui o código utiliando virtualenv: python3.10 -m venv venv && source venv/bin/activate
  • Instale as dependências: pip install -r requirements.txt

Execução

ETL

Os scripts devem ser executados a partir do caminho raiz do repositório usando o ambiente virtual criado acima.

microdados

indicadores

App local

Usando o ambiente virtual criado acima e estando na raiz do repositório, execute streamlit run app/home.py

About

ETL e visualização do Censo escolar

Topics

Resources

Stars

Watchers

Forks

Packages

No packages published