Skip to content

Commit 3662f82

Browse files
Fix typos and change the links
Revised and fixed typos, rephrased some sentences. Changed the path to the images.
1 parent 5a73ca0 commit 3662f82

File tree

1 file changed

+33
-34
lines changed
  • 3-Data-Visualization/10-visualization-distributions/translations

1 file changed

+33
-34
lines changed

3-Data-Visualization/10-visualization-distributions/translations/README.pt-br.md

Lines changed: 33 additions & 34 deletions
Original file line numberDiff line numberDiff line change
@@ -1,17 +1,17 @@
11
# Visualizando distribuições
22

3-
|![ Sketchnote por [(@sketchthedocs)](https://sketchthedocs.dev) ](../../sketchnotes/10-Visualizing-Distributions.png)|
3+
|![ Sketchnote por [(@sketchthedocs)](https://sketchthedocs.dev) ](../../../sketchnotes/10-Visualizing-Distributions.png)|
44
|:---:|
55
| Visualizando distribuições - _Sketchnote por [@nitya](https://twitter.com/nitya)_ |
66

7-
Na aula anterior, você aprendeu fatos interessantes sobre um dataset de pássaros de Minnesota. Você encontrou dados incorretos ao visualizar outliers e olhou as diferenças entre categorias de pássaros com base no seu comprimento máximo.
7+
Na aula anterior, você aprendeu fatos interessantes sobre um dataset de aves de Minnesota. Você encontrou dados incorretos ao visualizar outliers e olhou as diferenças entre categorias de aves com base no seu comprimento máximo.
88

99
## [Quiz pré-aula](https://red-water-0103e7a0f.azurestaticapps.net/quiz/18)
10-
## Explore o dataset de pássaros
10+
## Explorando o dataset de aves
1111

12-
Outra forma de explorar os dados é olhar para sua distribuição, ou como os dados estão organizados ao longo do eixo. Por exemplo, talvez você gostaria de aprender sobre a distribuição geral, nesse dataset, do máximo de envergadura (wingspan) ou máximo de massa corporal (body mass) dos pássaros de Minnesota.
12+
Outra forma de explorar os dados é olhar para sua distribuição, ou como os dados estão organizados ao longo do eixo. Por exemplo, talvez você gostaria de aprender sobre a distribuição geral, nesse dataset, do máximo de envergadura (wingspan) ou máximo de massa corporal (body mass) das aves de Minnesota.
1313

14-
Vamos descobrir alguns fatos sobre as distribuições de dados nesse dataset. No arquivo _notebook.ipynb_ na raiz do diretório dessa aula, importe Pandas, Matplotlib, e seus dados:
14+
Vamos descobrir alguns fatos sobre as distribuições de dados neste dataset. No arquivo _notebook.ipynb_, na raiz do diretório dessa aula, importe Pandas, Matplotlib, e os dados:
1515

1616
```python
1717
import pandas as pd
@@ -32,42 +32,42 @@ plt.xlabel('Max Length')
3232
plt.show()
3333
```
3434

35-
Isso nos dá uma visão geral da distribuição de comprimento de corpo por Ordem do pássaro, mas não é a forma ótima de mostrar a distribuição real. Essa tarefa geralmente é realizada usando um histograma.
35+
Isso nos dá uma visão geral da distribuição de comprimento do corpo por Ordem da ave, mas não é a melhor forma de mostrar a distribuição real. Essa tarefa geralmente é realizada usando um histograma.
3636

3737
## Trabalhando com histogramas
3838

39-
O Matplotlib oferece formas muito boas de visualizar distribuição dos dados usando histogramas. Esse tipo de gráfico é parecido com um gráfico de barras onde a distribuiçao pode ser vista por meio da subida e descida das barras. Para construir um histograma, você precisa de dados numéricos. Para construir um histograma, você pode plotar um gráfico definindo o tipo (kind) como 'hist' para histograma. Esse gráfico mostra a distribuição de massa corporal máxima (MaxBodyMass) para todo o intervalo numérico dos dados. Ao dividir um certo vetor de dados em intervalos (bins) menores, vemos a distribuição dos valores:
39+
O Matplotlib oferece formas muito boas de visualizar distribuição dos dados usando histogramas. Este tipo de gráfico é parecido com um gráfico de barras onde a distribuição pode ser vista por meio da subida e descida das barras. Para construir um histograma, você precisa de dados numéricos e você pode plotar um gráfico definindo o tipo (kind) como 'hist' para histograma. Este gráfico mostra a distribuição de massa corporal máxima (MaxBodyMass) para todo o intervalo numérico dos dados. Ao dividir um certo vetor de dados em intervalos (bins) menores, vemos a distribuição dos valores:
4040

4141
```python
4242
birds['MaxBodyMass'].plot(kind = 'hist', bins = 10, figsize = (12,12))
4343
plt.show()
4444
```
4545

46-
![Distribuição de todo o dataset](images/dist1.png)
46+
![Distribuição de todo o dataset](../images/dist1.png)
4747

48-
Como você pode ver, a maior parte dos mais de 400 pássaros cai no intervalo de menos de 2000 para a massa corporal máxima. Obtenha mais conhecimento dos dados mudando o parâmetro de intervalo (`bins`) para um número maior, como 30:
48+
Como você pode ver, a maior parte das mais de 400 aves cai no intervalo de menos de 2000 para a massa corporal máxima. Obtenha mais conhecimento dos dados mudando o parâmetro de intervalo (`bins`) para um número maior, como 30:
4949

5050
```python
5151
birds['MaxBodyMass'].plot(kind = 'hist', bins = 30, figsize = (12,12))
5252
plt.show()
5353
```
5454

55-
![Distribuição de todo o dataset com valores maiores de intervalo](images/dist2.png)
55+
![Distribuição de todo o dataset com valores maiores de intervalo](../images/dist2.png)
5656

57-
Esse gráfico mostra a distribuição de forma mais detalhada. Um gráfico menos concentrado na esquerda pode ser criado garantindo que você só seleciona os dados dentro de um certo intervalo:
57+
Este gráfico mostra a distribuição de forma mais detalhada. Um gráfico menos concentrado na esquerda pode ser criado garantindo que você só selecione os dados dentro de um certo intervalo:
5858

59-
Filtre seus dados para obter somente os pássaros que possuem menos de 60 de massa corporal, e mostre 40 intervalos (`bins`):
59+
Filtre seus dados para obter somente as aves que possuem menos de 60 de massa corporal, e mostre 40 intervalos (`bins`):
6060

6161
```python
6262
filteredBirds = birds[(birds['MaxBodyMass'] > 1) & (birds['MaxBodyMass'] < 60)]
6363
filteredBirds['MaxBodyMass'].plot(kind = 'hist',bins = 40,figsize = (12,12))
6464
plt.show()
6565
```
66-
![Histograma filtrado](images/dist3.png)
66+
![Histograma filtrado](../images/dist3.png)
6767

68-
✅ Tente outros filtros e pontos de dados (data points). Para ver a distribuição completa dos dados, remova o filtro `['MaxBodyMass']` para mostrar as distribuições com identificação.
68+
✅ Tente outros filtros e pontos de dados (data points). Para ver a distribuição completa dos dados, remova o filtro `['MaxBodyMass']` para mostrar as distribuições com labels (identificadores).
6969

70-
O histrograma também oferece algumas cores legais e identificadores (labels) melhorados:
70+
O histograma também oferece algumas cores legais e labels (identificares) melhorados:
7171

7272
Crie um histograma 2D para comparar a relação entre duas distribuições. Vamos comparar massa corporal máxima vs. comprimento máximo (`MaxBodyMass` vs. `MaxLength`). O Matplotlib possui uma forma integrada de mostrar convergência usando cores mais vivas:
7373

@@ -81,13 +81,13 @@ hist = ax.hist2d(x, y)
8181

8282
Aparentemente, existe uma suposta correlação entre esses dois elementos ao longo de um eixo esperado, com um forte ponto de convergência:
8383

84-
![Histrograma 2D](images/2D.png)
84+
![Histograma 2D](../images/2D.png)
8585

86-
Por definição, os histogramas funcionam para dados numéricos. E se você precisar ver distribuições de dados textuais?
86+
Por definição, os histogramas funcionam para dados numéricos. Mas, e se você precisar ver distribuições de dados textuais?
8787

8888
## Explore o dataset e busque por distribuições usando dados textuais
8989

90-
Esse dataset também inclui informações relevantes sobre a categoria de pássaro e seu gênero, espécie e família, assim como seu status de conservação. Vamos explorar mais a fundo essa informação sobre conservação. Qual é a distribuição dos pássaros de acordo com seu status de conservação?
90+
Este dataset também inclui informações relevantes sobre a categoria de ave e seu gênero, espécie e família, assim como seu status de conservação. Vamos explorar mais a fundo essa informação sobre conservação. Qual é a distribuição das aves de acordo com seu status de conservação?
9191

9292
> ✅ No dataset, são utilizados vários acrônimos para descrever o status de conservação. Esses acrônimos vêm da [IUCN Red List Categories](https://www.iucnredlist.org/), uma organização que cataloga os status das espécies.
9393
>
@@ -98,7 +98,7 @@ Esse dataset também inclui informações relevantes sobre a categoria de pássa
9898
> - NT: Near Threatened (Quase ameaçada)
9999
> - VU: Vulnerable (Vulnerável)
100100
101-
Esses são valores textuais, então será preciso transformá-los para criar um histograma. Usando o dataframe filteredBirds, mostre seu status de conservação juntamente com sua envergadura mínima (MinWingspan). O que você vê?
101+
Estes são valores textuais, então será preciso transformá-los para criar um histograma. Usando o dataframe filteredBirds, mostre seu status de conservação com sua envergadura mínima (MinWingspan). O que você vê?
102102

103103
```python
104104
x1 = filteredBirds.loc[filteredBirds.ConservationStatus=='EX', 'MinWingspan']
@@ -121,48 +121,47 @@ plt.gca().set(title='Conservation Status', ylabel='Max Body Mass')
121121
plt.legend();
122122
```
123123

124-
![Compilação envergadura e conservação](images/histogram-conservation.png)
124+
![Compilação envergadura e conservação](../images/histogram-conservation.png)
125125

126126
Aparentemente não existe uma correlação forte entre a envergadura mínima e o status de conservação. Teste outros elementos do dataset usando esse método. Você também pode tentar outros filtros. Você encontrou alguma correlação?
127127

128128
## Gráfico de densidade (Estimativa de densidade kernel)
129129

130130
Você pode ter percebido que até agora os histogramas são quebrados em degraus e não fluem de forma suave em uma curva. Para mostrar um gráfico de densidade mais 'fluido', você pode tentar usar a estimativa de densidade kernel (kde).
131131

132-
Para trabalhar com gráficos de densidade, acostume-se com uma nova biblioteca de gráficos, [Seaborn](https://seaborn.pydata.org/generated/seaborn.kdeplot.html).
132+
Para trabalhar com gráficos de densidade, acostume-se com uma nova biblioteca de gráficos, o [Seaborn](https://seaborn.pydata.org/generated/seaborn.kdeplot.html).
133133

134-
Depois de carregar o Seaborn, tente um gráfico de densidade básico:
134+
Após carregar o Seaborn, tente um gráfico de densidade básico:
135135

136136
```python
137137
import seaborn as sns
138138
import matplotlib.pyplot as plt
139139
sns.kdeplot(filteredBirds['MinWingspan'])
140140
plt.show()
141141
```
142-
![Gráfico de densidade](images/density1.png)
142+
![Gráfico de densidade](../images/density1.png)
143143

144-
Você consegue ver como o gráfico reflete o anterior (de envergadura mínima); só é mais fluido/suave. De acordo com a documentação do Seaborn, ""
145-
"Em comparação com o histograma, KDE pode produzir um gráfico que é menos confuso e mais legível, especialmente quando plotamos múltiplas distribuições. Mas pode potencialmente introduzir distorções se a distribuição usada é limitada ou não suave. Como um histograma, a qualidade da representação também depende na escolha de bons parâmetros suavizadores (smoothing parameters)." [créditos](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) Em outras palavras, dados discrepantes (outliers) vão fazer seus gráficos se comportarem mal, como sempre.
144+
Você consegue ver como o gráfico reflete o anterior (de envergadura mínima); só é mais fluido/suave. De acordo com a documentação do Seaborn, "Em comparação com o histograma, o KDE pode produzir um gráfico que é menos confuso e mais legível, especialmente quando plotamos múltiplas distribuições. Mas pode potencialmente introduzir distorções se a distribuição usada é limitada ou não suave. Como um histograma, a qualidade da representação também depende na escolha de bons parâmetros suavizadores (smoothing parameters)." [créditos](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) Em outras palavras, dados discrepantes (outliers) vão fazer seus gráficos se comportarem mal, como sempre.
146145

147146
Se você quer revisitar a linha irregular/dentada MaxBodyMass (massa corporal máxima) no segundo gráfico construído, você pode suavizá-la muito bem recriando o seguinte método:
148147

149148
```python
150149
sns.kdeplot(filteredBirds['MaxBodyMass'])
151150
plt.show()
152151
```
153-
![Linha suave massa corporal](images/density2.png)
152+
![Linha suave massa corporal](../images/density2.png)
154153

155154
Se você quer uma linha suave, mas não tão suave, mude o parâmetro `bw_adjust`:
156155

157156
```python
158157
sns.kdeplot(filteredBirds['MaxBodyMass'], bw_adjust=.2)
159158
plt.show()
160159
```
161-
![Linha menos suave massa corporal](images/density3.png)
160+
![Linha menos suave massa corporal](../images/density3.png)
162161

163162
✅ Leia sobre os parâmetros disponíveis para esse tipo de gráfico e experimente!
164163

165-
Esse tipo de gráfico oferece visualizações bonitas e esclarecedoras. Com algumas linhas de código, por exemplo, você pode mostrar a densidade de massa corporal máxima por pássaro por Ordem:
164+
Esse tipo de gráfico oferece visualizações bonitas e esclarecedoras. Com algumas linhas de código, por exemplo, você pode mostrar a densidade de massa corporal máxima por ave por Ordem:
166165

167166
```python
168167
sns.kdeplot(
@@ -172,17 +171,17 @@ sns.kdeplot(
172171
)
173172
```
174173

175-
![Massa corporal por Ordem](images/density4.png)
174+
![Massa corporal por Ordem](../images/density4.png)
176175

177-
Você também pode mapear a densidade de várias variáveis em um só gráfico. Teste usar o comprimento máximo (MaxLength) e mínimo (MinLength) de um pássaro comparado com seu status de conservação:
176+
Você também pode mapear a densidade de várias variáveis em um só gráfico. Teste usar o comprimento máximo (MaxLength) e mínimo (MinLength) de uma ave comparado com seu status de conservação:
178177

179178
```python
180179
sns.kdeplot(data=filteredBirds, x="MinLength", y="MaxLength", hue="ConservationStatus")
181180
```
182181

183-
![Múltiplas densidades sobrepostas](images/multi.png)
182+
![Múltiplas densidades sobrepostas](../images/multi.png)
184183

185-
Talvez valha a pena pesquisar mais a fundo se o cluster de pássaros vulneráveis ('Vulnerable') de acordo com seus comprimentos tem significado ou não.
184+
Talvez valha a pena pesquisar mais a fundo se o cluster de aves vulneráveis ('Vulnerable') de acordo com seus comprimentos têm significado ou não.
186185

187186
## 🚀 Desafio
188187

@@ -192,8 +191,8 @@ Histogramas são um tipo mais sofisticado de gráfico em relação a simples gr
192191

193192
## Revisão e autoestudo
194193

195-
Nessa aula, você usou o Matplotlib e começou a trabalhar com o Seaborn para mostrar gráficos mais avançados. Pesquise sobre o `kdeplot` no Seaborn, uma "curva de densidade de probabilidade contínua em uma ou mais dimensões". Leia a [documentação](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) para entender como funciona.
194+
Nesta aula, você usou o Matplotlib e começou a trabalhar com o Seaborn para mostrar gráficos mais avançados. Pesquise sobre o `kdeplot` no Seaborn, uma "curva de densidade de probabilidade contínua em uma ou mais dimensões". Leia a [documentação](https://seaborn.pydata.org/generated/seaborn.kdeplot.html) para entender como funciona.
196195

197196
## Tarefa
198197

199-
[Use suas habilidades](assignment.md)
198+
[Aplique seus conhecimentos](assignment.pt-br.md)

0 commit comments

Comments
 (0)