📌 Предсказание вероятности дефолта компании

🔍 Описание проекта

Цель проекта — разработать модель машинного обучения для прогнозирования вероятности того, что компания имеет признаки дефолта.
Основные источники данных: финансовая отчетность, судебные данные и государственные реестры. Командный github, папка PSB: https://github.com/XXXkoshaster/17-23.git

✅ Основные этапы реализации

1. Предобработка данных

Парсинг больших JSON-файлов из государственных реестров.
Обработка пропусков (статистические методы и бизнес-правила).
Масштабирование числовых признаков (scaling).
Удаление мультиколлинеарности через корреляционный анализ.

2. Инженерия признаков (Feature Engineering)

Построены динамические признаки, отражающие тренды изменения финансовых показателей компании.
Созданы признаки по судебным данным: количество дел, динамика их закрытия, типы дел.
Отбор наиболее значимых признаков с использованием анализа важности.

3. Обучение модели

Использована модель XGBoost, оптимизированная для табличных данных.
Настройка гиперпараметров через GridSearch и кросс-валидацию.
Оптимизация метрик (ROC-AUC, Precision-Recall) для дисбалансированных данных.

4. Интерпретация результатов

Применение SHAP для объяснения влияния признаков.
Построение отчетов с визуализацией факторов риска.

🛠 Технологический стек

Язык: Python
Библиотеки: Pandas, NumPy, Scikit-learn, XGBoost, SHAP
Визуализация: Matplotlib, Seaborn

📊 Результаты

ROC-AUC: ~0.72 на тестовой выборке

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
README.md		README.md
feature_engineering.ipynb		feature_engineering.ipynb
merging_dataset.ipynb		merging_dataset.ipynb
parcing_egrul.ipynb		parcing_egrul.ipynb
parcing_finances.ipynb		parcing_finances.ipynb
parcing_kad_arbitr.ipynb		parcing_kad_arbitr.ipynb
preprocessing_egrul.ipynb		preprocessing_egrul.ipynb
preprocessing_finances.ipynb		preprocessing_finances.ipynb
preprocessing_kad_arbitr.ipynb		preprocessing_kad_arbitr.ipynb
preprocessing_organizations.ipynb		preprocessing_organizations.ipynb
training.ipynb		training.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

📌 Предсказание вероятности дефолта компании

🔍 Описание проекта

✅ Основные этапы реализации

1. Предобработка данных

2. Инженерия признаков (Feature Engineering)

3. Обучение модели

4. Интерпретация результатов

🛠 Технологический стек

📊 Результаты

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

📌 Предсказание вероятности дефолта компании

🔍 Описание проекта

✅ Основные этапы реализации

1. Предобработка данных

2. Инженерия признаков (Feature Engineering)

3. Обучение модели

4. Интерпретация результатов

🛠 Технологический стек

📊 Результаты

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages