Kaggle competition: COVID-19 mRNA Vaccine Degradation Prediction
Kaggle竞赛:新冠mRNA疫苗降解预测
- checkpoints: 保存模型训练权重的文件夹;已保存训练好的权重,使用者可自行训练保存
- data: 包含数据预处理的类和函数
- dataset: 保存的是数据集;训练集和验证集有真实标签,但测试集没有
- layers: 包含三种模型的layer定义:GCN、GAT、GatedGCN
- log: 保存log信息的文件夹;已保存训练过的信息,保存时文件名称会命名为当前时间
- nets: 包含三种模型的net定义:GCN、GAT、GatedGCN
- plat: 包含各种画图函数和类,可以对原数据画图展示
- test: 包含测试文件,通过读取checkpoints中保存的训练权重,对测试集中数据进行测试
- train: 包含训练函数和评价指标函数
- Config.py: 模型的参数设置文件
- main.py: 主函数
- dgl>=0.4.2
- Anaconda (版本最好不要太旧)
- torch==1.6.0; torch_vision==0.7.0 及相关的包 (或者更高版本,可自行调试)
- logging; pandas; spicy; networkx (版本自行调试)
- 其他相关的包,可自行调试判断
- 本代码仅供学习和学术研究下载
- 安装指定的包
- 克隆后将文件夹变为Sources Root类型
- 使用Config.py对模型进行设置
- 运行main.py,调试并训练
- 使用plat文件中的函数对训练过程进行查看
- 使用test文件中的read_checkpoint.py对训练效果查看
- 模型名称:
GatedGCN
- 使用碱基对:
True
- 使用密码子:
True
- 使用循环类型:
True
- 使用位置编码:
False
位置编码维度:8
- init_lr:
0.001
weight_decay:0.0001
- num_epoch:
100
batch_size:16
- 使用损失函数类型:
MCRMSE
Wang567