Skip to content

Commit e176fb3

Browse files
authored
Merge branch 'microsoft:main' into main
2 parents e838288 + f48d7b1 commit e176fb3

File tree

192 files changed

+16505
-578
lines changed

Some content is hidden

Large Commits have some content hidden by default. Use the searchbox below for content that may be hidden.

192 files changed

+16505
-578
lines changed

1-Introduction/01-defining-data-science/README.md

Lines changed: 51 additions & 51 deletions
Large diffs are not rendered by default.

1-Introduction/01-defining-data-science/notebook.ipynb

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -70,7 +70,7 @@
7070
"\r\n",
7171
"The next step is to convert the data into the form suitable for processing. In our case, we have downloaded HTML source code from the page, and we need to convert it into plain text.\r\n",
7272
"\r\n",
73-
"There are many ways this can be done. We will use the simplest build-in [HTMLParser](https://docs.python.org/3/library/html.parser.html) object from Python. We need to subclass the `HTMLParser` class and define the code that will collect all text inside HTML tags, except `<script>` and `<style>` tags."
73+
"There are many ways this can be done. We will use the simplest built-in [HTMLParser](https://docs.python.org/3/library/html.parser.html) object from Python. We need to subclass the `HTMLParser` class and define the code that will collect all text inside HTML tags, except `<script>` and `<style>` tags."
7474
],
7575
"metadata": {}
7676
},
@@ -416,4 +416,4 @@
416416
},
417417
"nbformat": 4,
418418
"nbformat_minor": 2
419-
}
419+
}

1-Introduction/01-defining-data-science/translations/README.es.md

Lines changed: 171 additions & 0 deletions
Large diffs are not rendered by default.

1-Introduction/01-defining-data-science/translations/README.nl.md

Lines changed: 164 additions & 0 deletions
Large diffs are not rendered by default.

1-Introduction/01-defining-data-science/translations/README.pt-br.md

Lines changed: 165 additions & 0 deletions
Large diffs are not rendered by default.

1-Introduction/01-defining-data-science/translations/README.ru.md

Lines changed: 177 additions & 0 deletions
Large diffs are not rendered by default.
Lines changed: 32 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,32 @@
1+
# Tarea: Escenarios de la ciencia de datos
2+
3+
En esta primera tarea, os pedimos pensar sobre algún problema o proceso de la vida real en distintos contextos, y como se podrían solucionar o mejorar utilizando procesos de ciencia de datos. Piensa en lo siguiente:
4+
5+
1. ¿Qué datos puedes obtener?
6+
1. ¿Cómo los obtendrías?
7+
1. ¿Cómo los almacenarías? ¿Qué tamaño es podemos esperar que tengan los datos?
8+
1. ¿Qué información podrías ser capaz de extraer de estos datos? ¿qué decisiones podríamos tomar basándonos en ellos?
9+
10+
Intenta pensar en 3 diferentes problemas/procesos y describe cada uno de los puntos de arriba para el contexto de cada problema.
11+
12+
Estos son algunos problemas o contextos que pueden ayudarte a empezar a pensar:
13+
14+
1. ¿Cómo se pueden usar los datos para mejorar el proceso de educación de niños en los colegios?
15+
1. ¿Cómo podemos usar los datos para controlar la vacunación durante la pandemia?
16+
1. ¿Cómo se pueden usar los datos para asegurarnos de que somos productivos en nuestro trabajo?
17+
18+
## Instrucciones
19+
20+
Rellena la siguiente table (sustituye los problemas sugeridos por los propuestos por tí si es necesario):
21+
22+
| Contexto del problema | Problema | Qué datos obtener | Cómo almacenar los datos | Qué información/decisiones podemos tomar |
23+
|----------------|---------|-----------------------|-----------------------|--------------------------------------|
24+
| Educación | | | | |
25+
| Vacunación | | | | |
26+
| Productividad | | | | |
27+
28+
## Rúbrica
29+
30+
Ejemplar | Adecuada | Necesita mejorar
31+
--- | --- | -- |
32+
Es capaz de indentificar fuentes de datos razonables, formas de almacenarlos y posibles decisiones/información para todos los contextos | Algunos aspectos de la solución no están detallados, no se habla sobre el almacenamiento de los datos, al menos se describen dos contextos distintos | Solo se describen partes de la solución, solo se considera un contexto.
Lines changed: 31 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,31 @@
1+
# असाइनमेंट: डाटा साइंस के परिदृश्य
2+
3+
इस असाइनमेंट मे हम चाहते हैं कि आप कुछ असल ज़िंदगी की दिक्कतें या क्रिया-कलाप सोचें विभिन्न क्षेत्रों मे, और फिर सोचें कि इसको हम डाटा साइंस के प्रयोग से कैसे सुधार सकते हैं| इन चीजों के बारे मे सोचें:
4+
5+
1. आप कौनसी डाटा इकट्ठा कर सकते हैं?
6+
1. आप उसको कैसे इकट्ठा करेंगे?
7+
1. आप उस डाटा को कैसे संग्रहीत करेंगे? वो डाटा कितनी बड़ी होगी?
8+
1. अस डाटा से आपको क्या अनुमान मिलेगा? उस डाटा के आधार पर आप क्या निर्णय ले सकते हैं?
9+
10+
किन्ही 3 अलग दिक्कत या क्रिया-कलाप के बारे मे सोचे का प्रयास करें और ऊपर लिखे हर पॉइंट को अलग कार्यक्षेत्र के लिए वर्णित कीजिए|
11+
12+
यहा कुछ कार्यक्षेत्र और दिक्कतें लिखी हैं जिनकी मदद से आप सोचना शुरू कर सकते हैं:
13+
14+
1. आप डाटा का प्रयोग करके विद्यालय जा रहे बच्चों की शिक्षा कैसे सुधार सकते हैं?
15+
1. आप डाटा का प्रयोग करके महामारी के समय मे टीकाकरण कैसे नियंत्रित कर सकते हैं?
16+
1. आप डाटा का प्रयोग करके अपने काम मे कैसे और उत्पादक बन सकते हैं?
17+
## निर्देश:
18+
19+
निम्नलिखित मेज को भरें (अपने विकल्प सुझावित क्षेत्रों की जगह लिखें अगर जरूरत हो तो):
20+
21+
| समस्या डोमेन | समस्या | कॉनसी डाटा संग्रहीत करनी है | डाटा को कैसे संग्रहीत करना है | कॉन्से निर्णय ले सकते हैं |
22+
|----------------|---------|-----------------------|-----------------------|--------------------------------------|
23+
| शिक्षा | | | | |
24+
| टीकाकरण | | | | |
25+
| उत्पादकता | | | | |
26+
27+
## सरनामा
28+
29+
अनुकरणीय | पर्याप्त | सुधार चाहिए
30+
--- | --- | -- |
31+
डाटा के स्तोत्र को पहचानने मे, उसको भंडारित मे और निर्णय लेने मे सक्षम थे | समाधान के कुछ हिस्से विस्तृत नहीं हैं, डाटा को संग्रहीत करना नहीं बताया गया है, कम से कम दो क्षेत्रों का वर्णन है | समाधान के सिर्फ कुछ ही हिस्सों का वर्णन है, सिर्फ एक क्षेत्र पर विचार किया है|
Lines changed: 33 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,33 @@
1+
# Opdracht: Data Science Scenarios
2+
3+
In deze eerste opdracht vragen we je na te denken over processen of problemen van verschillende aspecten van het echte leven. Om vervolgens na te denken over hoe je deze kan verbeteren met Data Science. Denk bijvoorbeeld aan;
4+
5+
1. Welke data kan ik verzamelen
6+
2. Hoe kan ik deze data verzamelen?
7+
3. Hoe wil ik deze data opslaan? Hoe groot zal de hoeveelheid data worden?
8+
4. Wat voor inzichten wil ik krijgen op deze data? Welke beslissingen kan ik gaan maken aan de hand van deze data?
9+
10+
Probeer 3 verschillende problemen/processen te bedenken, en beschrijf voor elk van deze items het onderwerp van het probleem.
11+
12+
Hier zijn wat voorbeeld onderwerpen om je in de goede richting te helpen:
13+
14+
1. Hoe kan ik data gebruiken om het leertraject van kinderen op school te verbeteren?
15+
2. Hoe kan ik data gebruiken om controle te krijgen op het vaccinatieprocess tijdens de pandemie?
16+
3. Hoe kan ik data gebruiken om inzicht te krijgen in mijn productiviteit op het werk?
17+
18+
19+
## Instructies
20+
21+
Vul de volgende tabel in (vul je eigen onderwerp in, indien nodig):
22+
23+
| Probleem Onderwerp | Probleem | Welke data te verzamelen | Hoe de data te verzamelen | Welke inzichten/beslissingen wil ik maken |
24+
|----------------|---------|-----------------------|-----------------------|--------------------------------------|
25+
| Onderwijs | | | | |
26+
| Vaccinaties | | | | |
27+
| Productiviteit | | | | |
28+
29+
## Rubriek
30+
31+
Uitstekend | Adequaat | Vereist verbetering
32+
--- | --- | -- |
33+
Men kon voldoende databronnen vinden, deze juist opslaan en hier de juiste inzichten aan ontlenen voor alle probleemstellingen. | Sommige aspecten van de oplssing zijn niet concreet, de data opslag is niet gedefinieerd, tenminste 2 van de probleemstellingen zijn besproken. | Enkel onderdelen vand e oplossing zijn beschreven, slechts een van de probleemstellingen is besproken.
Lines changed: 31 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,31 @@
1+
# Tarefa: Cenários de Ciência de Dados
2+
3+
Nessa primeira tarefa, nós pedimos que você pense sobre algum processo ou problema da vida real em diferentes domínios de problemas, e como você pode melhorar isso usando o processo de Ciência de Dados: Pense sobre:
4+
5+
1. Quais dados você pode coletar?
6+
1. Como você coletaria os dados?
7+
1. Como você armazenaria os dados? O quão grande os dados provavelmente são?
8+
1. Quais insights você pode ter a partir desses dados? Quais decisões nós podemos fazer baseando-se nos dados?
9+
10+
Tente pensar sobre 3 diferentes problemas/processos e descreva cada um dos pontos acimas para cada domínio de problemas.
11+
12+
Aqui estão alguns dos domínio de problemas e problemas que podem te ajudar a começar a pensar:
13+
14+
1. Como você usa dados para melhorar o processo de educação para crianças nas escolas?
15+
1. Como você usa dados para controlar vacinação em uma pandemia?
16+
1. Como você usa dados para garantir que você está sendo produtivo no trabalho?
17+
## Instruções
18+
19+
Preencha a seguinte tabela (substitua os domínios de problemas sugeridos pelos os seus próprios se necessário):
20+
21+
| Domínio de Problema | Problema | Quais dados a serem coletados | Como armazenar os dados | Quais insights/decisões nós podemos fazer |
22+
|----------------|---------|-----------------------|-----------------------|--------------------------------------|
23+
| Educação | | | | |
24+
| Vacinação | | | | |
25+
| Produtividade | | | | |
26+
27+
## Rubrica
28+
29+
Exemplar | Adequado | Precisa melhorar
30+
--- | --- | -- |
31+
Um foi capaz de identificar fontes de dados razoáveis, formas de armazenar dados e possíveis insights/decisões para todos os domínios de problema | Alguns dos aspectos da solução não estão detalhados, armazenamento de dados não é discutido, pelo menos 2 domínios de problemas são descritos | Apenas parte da solução de dados são descritas, apenas um domínio de problema é considerado.

0 commit comments

Comments
 (0)