Skip to content

Commit bfc672a

Browse files
authored
Merge pull request microsoft#176 from fortis3000/main
[RU-Russian] translation
2 parents c106dd6 + 8138788 commit bfc672a

File tree

9 files changed

+431
-0
lines changed

9 files changed

+431
-0
lines changed

1-Introduction/01-defining-data-science/translations/README.ru.md

Lines changed: 177 additions & 0 deletions
Large diffs are not rendered by default.
Lines changed: 32 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,32 @@
1+
# Домашнее задание: сценарии в науке о данных
2+
3+
В первом домашнем задании Вам предлагается рассмотреть процессы в реальном мире или проблемы в различных областях и как вы можете улучшить положение дел используя науку о данных. Ответьте на следующие вопросы:
4+
5+
1. Какие данные Вы планируете собирать?
6+
1. Как Вы хотите собрать данные?
7+
1. Как Вы будете хранить данные? Насколько большими будут они?
8+
1. Какие инсайты Вы сможете извлечь из этих данных? Какие решения сможете принять на основе этих данных?
9+
10+
Подумайте о трёх различных проблемах/процессах и опишите каждую по пунктам, приведённым выше.
11+
12+
Ниже приведены некоторые области и проблемы в них, с которых Вы можете начать:
13+
14+
1. Как можно использовать данные, чтобы улучшить образовательный процесс в школах?
15+
1. Как можно использовать данные, чтобы управлять вакцинацией в период пандемии?
16+
1. Как можно использовать данные, чтобы повысить свою продуктивность на работе?
17+
18+
## Форма ответов
19+
20+
Заполните следующую таблицу (замените предложенные области на другие, если необходимо):
21+
22+
| Область | Проблема | Какие данные нужно собрать | Как хранить данные | Какие инсайты/решения можно извлечь/принять |
23+
|----------------|---------|-----------------------|-----------------------|--------------------------------------|
24+
| Образование | | | | |
25+
| Вакцинация | | | | |
26+
| Продуктивность | | | | |
27+
28+
## Оценка
29+
30+
Отлично | Достаточно | Нуждается в улучшении
31+
--- | --- | -- |
32+
Верно определены источники данных, способы хранения данных и возможные решения/инсайты для всех областей | Некоторые аспекты решения недостаточно детально рассмотрены, хранилища данных не рассмотрены, рассмотрены по меньшей мере 2 области | Решение неполное, рассмотрена только одна область
Lines changed: 17 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,17 @@
1+
# Введение в науку о данных
2+
3+
![data in action](../images/data.jpg)
4+
> Photo by <a href="https://unsplash.com/@dawson2406?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Stephen Dawson</a> on <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Unsplash</a>
5+
6+
Пройдя данные уроки Вы узнаете, что такое наука о данных и изучите этические аспекты, которые должен учитывать каждый дата сайентист. Вы также узнаете, что такое данные и немного познакомитесь со статистикой и теорией вероятности, центральной областью науки о данных.
7+
8+
### Разделы
9+
10+
1. [Что такое наука о данных](01-defining-data-science/README.md)
11+
2. [Этика и наука о данных](02-ethics/README.md)
12+
3. [Что такое данные](03-defining-data/README.md)
13+
4. [Введение в статистику и теорию вероятности](04-stats-and-probability/README.md)
14+
15+
### Благодарности
16+
17+
Данные уроки были написаны с ❤️ [Nitya Narasimhan](https://twitter.com/nitya) и [Dmitry Soshnikov](https://twitter.com/shwars).
Lines changed: 17 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,17 @@
1+
# Работа с данными
2+
3+
![data love](../images/data-love.jpg)
4+
> Photo by <a href="https://unsplash.com/@swimstaralex?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Alexander Sinn</a> on <a href="https://unsplash.com/s/photos/data?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Unsplash</a>
5+
6+
На этих уроках Вы изучите способы управления данными, методы работы с ними и как данные могут быть использованы в приложениях. Вы познакомитесь с реляционными и нереляционными базами данных и с тем, как они хранят данные. Вы овладеете основами обработки данных при помощи языка программирования Python.
7+
8+
### Разделы
9+
10+
1. [Реляционные базы данных](05-relational-databases/README.md)
11+
2. [Нереляционные базы данных](06-non-relational/README.md)
12+
3. [Работа с языком программирования Python](07-python/README.md)
13+
4. [Подготовка данных](08-data-preparation/README.md)
14+
15+
### Благодарности
16+
17+
Данные уроки были написаны с ❤️ [Christopher Harrison](https://twitter.com/geektrainer), [Dmitry Soshnikov](https://twitter.com/shwars) и [Jasmine Greenaway](https://twitter.com/paladique)
Lines changed: 29 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,29 @@
1+
# Визуализация данных
2+
3+
![a bee on a lavender flower](../images/bee.jpg)
4+
> Photo by <a href="https://unsplash.com/@jenna2980?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Jenna Lee</a> on <a href="https://unsplash.com/s/photos/bees-in-a-meadow?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Unsplash</a>
5+
6+
7+
Визуализация данных - это одна из важнейших задач дата сайентиста. Одним графиком можно заменить тысячу слов. Именно визуализация может помочь Вам распознать все особенности Ваших данных, такие как всплески, выбросы, группы, тренды и др., и понять, какую историю хранят в себе Ваши данные.
8+
9+
В этих пяти уроках Вам предлагается исследовать природные данные и создать красивую визуализацию с использованием различных инструментов.
10+
11+
### Разделы
12+
13+
1. [Визуализация количественных данных](09-visualization-quantities/README.md)
14+
1. [Визуализация распределения данных](10-visualization-distributions/README.md)
15+
1. [Визуализация пропорций](11-visualization-proportions/README.md)
16+
1. [Визуализация связей](12-visualization-relationships/README.md)
17+
1. [Выразительная визуализация](13-meaningful-visualizations/README.md)
18+
19+
### Благодарности
20+
21+
Данные уроки были написаны с 🌸 [Джен Лупер](https://twitter.com/jenlooper).
22+
23+
🍯 Данные о производстве мёда в США хранятся в проекте Джессики Ли на портале [Kaggle](https://www.kaggle.com/jessicali9530/honey-production). [Данные](https://usda.library.cornell.edu/concern/publications/rn301137d) были получены от [министерства сельского хозяйства США](https://www.nass.usda.gov/About_NASS/index.php).
24+
25+
🍄 Данные о разнообразии грибов выложены при содействии Хаттерас Дантон и также хранятся на портале [Kaggle](https://www.kaggle.com/hatterasdunton/mushroom-classification-updated-dataset). Данный датасет содержит экземпляры 23 видов Агариковых (Пластинчатых) грибов семейства Шампиньоновые. Грибы были нарисованы в книге "The Audubon Society Field Guide to North American Mushrooms" в 1981 году. Данный датасет был передан репозиторию UCI ML в 1987 году.
26+
27+
🦆 Данные о разнообразии птиц Миннесоты расположены на портале [Kaggle](https://www.kaggle.com/hannahcollins/minnesota-birds) и были собраны с сайта [Wikipedia](https://en.wikipedia.org/wiki/List_of_birds_of_Minnesota) Ханной Коллинс.
28+
29+
Все датасеты распространяются по лицензии [CC0: Creative Commons](https://creativecommons.org/publicdomain/zero/1.0/).
Lines changed: 16 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,16 @@
1+
# Введение в жизненный цикл проекта в области науки о данных
2+
3+
![communication](../images/communication.jpg)
4+
> Photo by <a href="https://unsplash.com/@headwayio?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Headway</a> on <a href="https://unsplash.com/s/photos/communication?utm_source=unsplash&utm_medium=referral&utm_content=creditCopyText">Unsplash</a>
5+
6+
В данных уроках вы познакомитесь с этапами жизненного циклы проекта в области науки о данных, включая анализ данных и взаимодействие на их основе.
7+
8+
### Разделы
9+
10+
1. [Введение в жизненный цикл проекта в области науки о данных](14-Introduction/README.md)
11+
2. [Анализ данных](15-Analyzing/README.md)
12+
3. [Взаимодействие на основе данных](16-communication/README.md)
13+
14+
### Благодарности
15+
16+
Данные уроки были написаны с ❤️ [Jalen McGee](https://twitter.com/JalenMCG) и [Jasmine Greenaway](https://twitter.com/paladique)
Lines changed: 22 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,22 @@
1+
# Наука о данных в облачной инфраструктуре
2+
3+
![cloud-picture](../images/cloud-picture.jpg)
4+
5+
> Photo by [Jelleke Vanooteghem](https://unsplash.com/@ilumire) from [Unsplash](https://unsplash.com/s/photos/cloud?orientation=landscape)
6+
7+
Когда приходит время анализировать по-настоящему большие данные, использование облачных технологий может обеспечить неоспоримое преимущество. В следующих трёх уроках вы узнаете, что такое облачная инфраструктура и чем она может быть полезна. Для этого мы исследуем набор данных о сердечной недостаточности и построим модель оценки вероятности появления данной болезни. Мы применим все преимущества облачных технологий для тренировки, развёртывания и использования модели в двумя способами. Первый спосои - это использование только пользовательского интерфейса с минимальным применением программирования, второй - использование инструмента под названием Azure Machine Learning Software Developer Kit (Azure ML SDK).
8+
9+
![project-schema](../19-Azure/images/project-schema.PNG)
10+
11+
### Разделы
12+
13+
1. [Преимущества облачной инфраструктуры для науки о данных.](17-Introduction/README.md)
14+
2. [Наука о данных в облачной инфраструктуре: подходы с минимальным использованием программирования и без него.](18-Low-Code/README.md)
15+
3. [Наука о данных в облачной инфраструктуре: применение Azure ML SDK](19-Azure/README.md)
16+
17+
### Благодарности
18+
Данные уроки были написаны с ☁️ и 💕 [Maud Levy](https://twitter.com/maudstweets) and [Tiffany Souterre](https://twitter.com/TiffanySouterre)
19+
20+
21+
Данные для прогнозирования сердечной недостаточности были собраны [
22+
Larxel](https://www.kaggle.com/andrewmvd) и хранятся на портале [Kaggle](https://www.kaggle.com/andrewmvd/heart-failure-clinical-data). Датасет распространятеся по лицензии [Attribution 4.0 International (CC BY 4.0)](https://creativecommons.org/licenses/by/4.0/)
Lines changed: 11 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,11 @@
1+
# Наука о данных на практике
2+
3+
Примеры реального использования науки о данных в приложениях во многих отраслях.
4+
5+
### Разделы
6+
7+
1. [Наука о данных на практике](20-Real-World-Examples/README.md)
8+
9+
### Благодарности
10+
11+
Написано с ❤️ [Nitya Narasimhan](https://twitter.com/nitya)

0 commit comments

Comments
 (0)