- 📝 Descrição do Projeto
- ⚙️ Tecnologias Utilizadas
- 📁 Estrutura do Projeto
- 🚀 Funcionalidades e Demonstração
- 💻 Como Usar a Aplicação
- 👥 Equipe do Projeto
- ✅ Conclusão
- 📸 Prévia do Projeto
O Dashboard Interativo de Salários é um projeto de análise de dados desenvolvido durante a Imersão de Dados com Python da Alura. O objetivo é realizar a análise exploratória e o tratamento de uma base de dados sobre salários na área de tecnologia, culminando na construção e implantação de um dashboard interativo. Este projeto demonstra habilidades em manipulação de dados com Pandas, criação de visualizações interativas com Plotly e desenvolvimento de dashboards com Streamlit.
- Python: Linguagem de programação principal.
- Pandas: Biblioteca para manipulação e análise de dados.
- NumPy: Biblioteca para computação numérica, utilizada para lidar com valores nulos (
NaN
). - Plotly: Biblioteca para criação de visualizações e gráficos interativos, incluindo o mapa coroplético.
- Streamlit: Framework para construir e implantar dashboards e aplicativos web.
- Visual Studio Code: IDE (Ambiente de Desenvolvimento Integrado) utilizada no desenvolvimento.
- Jupyter Notebooks: Ambiente para desenvolvimento e execução interativa do código.
.
├── app.py
├── requirements.txt
├── dF/
├── dados/
├── .venv/
└── .gitignore
A estrutura do projeto é a seguinte:
app.py
: O arquivo principal do dashboard, escrito em Streamlit.requirements.txt
: Lista todas as bibliotecas e dependências necessárias para o projeto.dF
: A base de dados ORIGINAL.dados
: A base de dados tratada, utilizada pelo dashboard..venv/
: O ambiente virtual do projeto, que contém todas as bibliotecas instaladas..gitignore
: Arquivo para ignorar arquivos e pastas que não devem ser enviados para o repositório, como.venv
.
- Dashboard Interativo: Interface para explorar os dados de salários.
- Filtros Dinâmicos: Permite filtrar os dados por diferentes categorias, como experiência e cargo.
- Visualizações Gráficas: Exibe salários médios, máximos e outras métricas em gráficos interativos.
- Mapa Coroplético: Permite visualizar a distribuição de salários por localização geográfica.
O projeto foi estruturado para realizar a análise exploratória e a visualização de uma base de dados de salários na área de tecnologia, com o objetivo de construir um dashboard interativo. O fluxo de trabalho técnico é o seguinte:
-
Coleta e Importação de Dados: A base de dados é importada diretamente de um repositório no GitHub para um DataFrame, usando a biblioteca
pandas
.- A base de dados original é carregada com o comando
pd.read_csv()
, que aponta para o arquivosalaries.csv
.
- A base de dados original é carregada com o comando
-
Análise e Preparação:
- Inspeção Inicial: O
DataFrame
é analisado para entender sua estrutura, tipos de dados e dimensões usando métodos como.head()
,.info()
e.shape
. - Tradução e Padronização: Os nomes das colunas e os valores categóricos (como "SE" para Sênior, "FT" para Tempo Integral) são traduzidos e padronizados para o português, tornando a análise mais intuitiva.
- Tratamento de Nulos: A presença de valores nulos na coluna
ano
é identificada e, para garantir a consistência, as linhas afetadas são removidas com o métododf.dropna()
. O tipo de dado da colunaano
é então convertido defloat
paraint
.
- Inspeção Inicial: O
-
Análise e Visualização de Dados:
- Distribuições Salariais: Gráficos como
barplot
eboxplot
doseaborn
são gerados para visualizar a média e a distribuição dos salários em relação à senioridade. - Exploração Gráfica: Um histograma é usado para mostrar a frequência dos salários, enquanto gráficos de rosca (
pie
doplotly
) são utilizados para analisar a proporção de tipos de trabalho (Remoto, Presencial e Híbrido). - Visualização Geográfica: Um mapa coroplético (
choropleth
doplotly
) é criado para ilustrar o salário médio de Cientistas de Dados por país, permitindo uma análise espacial dos dados.
- Distribuições Salariais: Gráficos como
-
Exportação para o Dashboard: Por fim, o
DataFrame
limpo e tratado é salvo em um novo arquivoCSV
, que serve como a fonte de dados para o dashboard interativo construído com oStreamlit
.
Para executar este projeto localmente, siga os passos abaixo:
- Instale o Python 3.x em sua máquina.
- Clone o repositório do projeto.
git clone https://github.com/amaro-netto/ImersaoAlura-DadosComPython.git
- Abra a pasta no VS Code ou terminal.
cd [nome do seu-repositório]
- Crie e ative um ambiente virtual para o projeto:
python -m venv venv # Windows: .\venv\Scripts\activate # macOS/Linux: source venv/bin/activate
- Instale as dependências a partir do arquivo
requirements.txt
:pip install -r requirements.txt
- Para rodar o dashboard localmente, use o comando no terminal:
streamlit run app.py
Este projeto foi uma experiência de aprendizado valiosa, demonstrando a aplicação de bibliotecas como Pandas, Plotly e Streamlit para análise e visualização de dados. A imersão permitiu aprofundar conhecimentos em tratamento de dados e na construção de dashboards interativos.
