Patient Survival Prediction using EHR Data

Predict patient survival (mortality) using Electronic Health Records (EHR) with machine learning.
This project uses multiple ML models, handles class imbalance, and interprets predictions with SHAP.

🗂 Project Structure

Dataset/ : Original dataset(https://www.kaggle.com/competitions/patient-survival-prediction/data)
Notebooks/ : EDA, preprocessing, feature engineering, and model building in Colab

📊 Dataset

Source: [Patient Survival Prediction]
Rows: 91,713
Columns: 85
Features: Demographics, vitals, lab results, ICU scores (APACHE)
Target: survived (0 = Died, 1 = Survived)
Class distribution: Imbalanced → handled using SMOTE and class-weighted models

🛠 Approach

Data Cleaning & Preprocessing
- Handle missing values using mean/median/mode
- Remove duplicates
- Encode categorical variables
- Scale numeric features
Feature Selection
- ANOVA F-test, Mutual Information, Lasso
Modeling
- Logistic Regression (with Polynomial Features)
- Random Forest (class_weight='balanced')
- XGBoost
- SVM, MLP Classifier
- Train/Test split with stratification
Class Imbalance Handling
- SMOTE oversampling on training data
- Class-weight balancing in models
Model Evaluation
- Accuracy, F1-score, Recall, Precision
- ROC-AUC and confusion matrix
Interpretability
- SHAP TreeExplainer on XGBoost for feature importance and individual predictions

📈 Results

Top predictive features: ICU death probability, SpO₂ min, temperature min, Glasgow Coma Scale, ventilated status
Best performing model: XGBoost (Accuracy: ~0.88, F1-score: ~0.93, ROC-AUC: ~0.88)
SHAP insights:
- High ICU mortality probability → increases predicted death
- Low oxygen saturation → higher mortality risk
- Ventilated patients → higher predicted death risk

Example SHAP Summary Plot:

Example MODEL COMPARISION:

Example ROC-AUC:

⚙ How to run

Clone the repo:

git clone https://github.com/Srikeerthiraja/patient_survival_ml.git
cd patient_survival_ml

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
outputs		outputs
Dataset		Dataset
Patient_Survival_finalcode.ipynb		Patient_Survival_finalcode.ipynb
README.md		README.md
Requirements.txt		Requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Patient Survival Prediction using EHR Data

🗂 Project Structure

📊 Dataset

🛠 Approach

📈 Results

⚙ How to run

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Patient Survival Prediction using EHR Data

🗂 Project Structure

📊 Dataset

🛠 Approach

📈 Results

⚙ How to run

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages