Skip to content

Latest commit

 

History

History
34 lines (21 loc) · 1.91 KB

File metadata and controls

34 lines (21 loc) · 1.91 KB

Модуль 6. Навчання без вчителя.

З циклу домашніх завдань Python Data Science.

Домашнє завдання

Завдання, що пропонуються, необхідно оформити у вигляді одного jupyter ноутбука.

Завдання 1

У цьому завданні вам потрібно завантажити ось цей датасет. Тут ви знайдете 2 файли - з двовимірним датасетом та датасетом mnist. Для кожного з них застосуйте алгоритм K-means для кластеризації. Щоб знайти оптимальну кількість кластерів, скористайтесь ліктевим методом.

Завдання 2

Візуалізуйте результат роботи кластеризації. Для випадку з mnist датасетом, вам потрібно ще скористатись алгоримтом PCA щоб зменшити розмірність вашим даних до 2-вимірного варіанту.

Результат

Завдання 1

Резульат розбитя на кластери зорбражень з бази MNIST

784 ознак, k=19

PCA (0.95), 114 ознак, k=13

Завдання 2