Skip to content

fUtuR17/credit_scoring

Repository files navigation

📌 Предсказание вероятности дефолта компании

🔍 Описание проекта

Цель проекта — разработать модель машинного обучения для прогнозирования вероятности того, что компания имеет признаки дефолта.
Основные источники данных: финансовая отчетность, судебные данные и государственные реестры. Командный github, папка PSB: https://github.com/XXXkoshaster/17-23.git

✅ Основные этапы реализации

1. Предобработка данных

  • Парсинг больших JSON-файлов из государственных реестров.
  • Обработка пропусков (статистические методы и бизнес-правила).
  • Масштабирование числовых признаков (scaling).
  • Удаление мультиколлинеарности через корреляционный анализ.

2. Инженерия признаков (Feature Engineering)

  • Построены динамические признаки, отражающие тренды изменения финансовых показателей компании.
  • Созданы признаки по судебным данным: количество дел, динамика их закрытия, типы дел.
  • Отбор наиболее значимых признаков с использованием анализа важности.

3. Обучение модели

  • Использована модель XGBoost, оптимизированная для табличных данных.
  • Настройка гиперпараметров через GridSearch и кросс-валидацию.
  • Оптимизация метрик (ROC-AUC, Precision-Recall) для дисбалансированных данных.

4. Интерпретация результатов

  • Применение SHAP для объяснения влияния признаков.
  • Построение отчетов с визуализацией факторов риска.

🛠 Технологический стек

  • Язык: Python
  • Библиотеки: Pandas, NumPy, Scikit-learn, XGBoost, SHAP
  • Визуализация: Matplotlib, Seaborn

📊 Результаты

  • ROC-AUC: ~0.72 на тестовой выборке

About

solution developed for PSB Bank

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors