Данный проект направлен на автоматическую детекцию людей на изображениях, полученных с беспилотных авиационных систем (БАС), с использованием современных нейросетевых технологий. В работе:
-
Выполнена предобработка датасета: масштабирование изображений, удаление выбросов.
-
Произведено дообучение модели YOLO11n на очищенном наборе данных.
-
Проведена валидация модели с построением ключевых метрик.
-
Реализован постпроцессинг предсказаний:
- Clipping предсказанных рамок.
- Non-Maximum Suppression (NMS).
- Фильтрация по размерам bounding box.
https://www.kaggle.com/code/vasilyartonkin/splitting-data
- Масштабирование изображений для унификации размера.
- Удаление выбросов для улучшения качества данных.
- Разбиение выборки на обучающую, валидационную, тестовую
https://www.kaggle.com/code/vasilyartonkin/training-yolo11n
- Использована архитектура YOLO11n как лёгкая и быстрая модель для инференса на UAV.
- Дообучение на кастомном наборе данных.
- Использование аугментаций для повышения обобщающей способности.
https://www.kaggle.com/code/vasilyartonkin/validation-cv
- Оценка по метрикам Precision, Recall, mAP50-95.
- Построение кривых PR и графика F1 vs Confidence.
- Clipping рамок для исключения выхода за границы изображения.
- Non-Maximum Suppression (NMS) для удаления дубликатов.
- Фильтрация рамок по минимальному размеру.
- YOLO11n
- PyTorch
- OpenCV
- Albumentations
- NumPy / Pandas
- Matplotlib / Seaborn

