Skip to content

Kaggle竞赛:新冠mRNA疫苗降解预测 <br> Kaggle Competition: Degradation Prediction of COVID-19 mRNA Vaccine

License

Notifications You must be signed in to change notification settings

wangluchen567/mRNA_II

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

mRNA_II (mRNA 2.0)

介绍

Kaggle competition: COVID-19 mRNA Vaccine Degradation Prediction

Kaggle竞赛:新冠mRNA疫苗降解预测

模型架构

  • checkpoints: 保存模型训练权重的文件夹;已保存训练好的权重,使用者可自行训练保存
  • data: 包含数据预处理的类和函数
  • dataset: 保存的是数据集;训练集和验证集有真实标签,但测试集没有
  • layers: 包含三种模型的layer定义:GCN、GAT、GatedGCN
  • log: 保存log信息的文件夹;已保存训练过的信息,保存时文件名称会命名为当前时间
  • nets: 包含三种模型的net定义:GCN、GAT、GatedGCN
  • plat: 包含各种画图函数和类,可以对原数据画图展示
  • test: 包含测试文件,通过读取checkpoints中保存的训练权重,对测试集中数据进行测试
  • train: 包含训练函数和评价指标函数
  • Config.py: 模型的参数设置文件
  • main.py: 主函数

使用准备

  • dgl>=0.4.2
  1. Anaconda (版本最好不要太旧)
  2. torch==1.6.0; torch_vision==0.7.0 及相关的包 (或者更高版本,可自行调试)
  3. logging; pandas; spicy; networkx (版本自行调试)
  4. 其他相关的包,可自行调试判断

使用说明

  • 本代码仅供学习和学术研究下载
  1. 安装指定的包
  2. 克隆后将文件夹变为Sources Root类型
  3. 使用Config.py对模型进行设置
  4. 运行main.py,调试并训练
  5. 使用plat文件中的函数对训练过程进行查看
  6. 使用test文件中的read_checkpoint.py对训练效果查看

最优参数

  • 模型名称: GatedGCN
  • 使用碱基对: True
  • 使用密码子: True
  • 使用循环类型: True
  • 使用位置编码: False 位置编码维度: 8
  • init_lr: 0.001 weight_decay: 0.0001
  • num_epoch: 100 batch_size: 16
  • 使用损失函数类型: MCRMSE

最优参数训练和验证损失变化

参与贡献

Wang567

About

Kaggle竞赛:新冠mRNA疫苗降解预测 <br> Kaggle Competition: Degradation Prediction of COVID-19 mRNA Vaccine

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages