You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Цель проекта — разработать модель машинного обучения для прогнозирования вероятности того, что компания имеет признаки дефолта.
Основные источники данных: финансовая отчетность, судебные данные и государственные реестры.
Командный github, папка PSB: https://github.com/XXXkoshaster/17-23.git
✅ Основные этапы реализации
1. Предобработка данных
Парсинг больших JSON-файлов из государственных реестров.
Обработка пропусков (статистические методы и бизнес-правила).
Масштабирование числовых признаков (scaling).
Удаление мультиколлинеарности через корреляционный анализ.
2. Инженерия признаков (Feature Engineering)
Построены динамические признаки, отражающие тренды изменения финансовых показателей компании.
Созданы признаки по судебным данным: количество дел, динамика их закрытия, типы дел.
Отбор наиболее значимых признаков с использованием анализа важности.
3. Обучение модели
Использована модель XGBoost, оптимизированная для табличных данных.
Настройка гиперпараметров через GridSearch и кросс-валидацию.
Оптимизация метрик (ROC-AUC, Precision-Recall) для дисбалансированных данных.
4. Интерпретация результатов
Применение SHAP для объяснения влияния признаков.
Построение отчетов с визуализацией факторов риска.