展示 Demo 与模型训练说明文档

本说明文档介绍了该项目的 Demo 展示方式、训练流程、代码结构与关键模块功能。

展示 Demo 操作指南

启动前准备：
- 确保预训练模型路径已正确设置；
- 确认提示词内容符合预期；
- 默认最大句子长度为 10000 tokens；
注意事项：
- 请特别注意 推理过程中的内存释放，以避免显存溢出；
- 推荐在 GPU 显存充足的设备上运行。

简要训练流程

# 激活虚拟环境
conda activate sum_env

# 进入训练代码目录
cd DiabetesPDiagLLM/

# 执行训练脚本
python src/train/train.py

请先在 utils.py 中完成 数据预处理；
再启动训练脚本进行模型训练。

项目功能模块说明

该库是一个完整的医疗文本分析模型训练与展示系统，包含以下功能模块：

功能	说明
模型训练	支持 DeepSeek-32B 模型微调训练
推理调用	封装独立推理函数用于生产部署
Demo 展示	模拟用户输入的前端展示界面
能力比较	可视化不同模型输出效果进行评估

模块与目录说明

`demo/` 文件夹

存放用于模拟用户直接输入的交互式展示脚本；

`src/train/` 目录介绍

`DS_train.py`

主要训练脚本；
使用 DeepSeek-32B 模型进行微调训练；
输出模型权重保存至指定目录。

`Tensorboard.py`

调用 Tensorboard 对训练过程进行图形化展示；
每次训练输出图像默认以 .png 格式保存至根目录。

`save.py`

本身train.py具有保存模型功能，该代码仅在train保存失败，显存溢出等情况使用；
每次训练结果保存在base_model_ckpt目录下。

`DS_inference.py`

提供模型加载与推理函数；
为工作流模块提供支持，保证模型可独立初始化调用；
与训练流程解耦，便于后续部署与封装。
与 Gradio 或 CLI 环境连接进行实时推理。

如需进一步展示或集成 Gradio 界面，请确保推理模块接口标准化（如：支持 inference(text, model, tokenizer)）。

如有路径配置、虚拟环境或模块结构问题，请联系开发者获取支持。

Author

MangguoD

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
DiabetesPDiagLLM		DiabetesPDiagLLM
demo		demo
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
download-llm.py		download-llm.py
pip-list.txt		pip-list.txt
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

展示 Demo 与模型训练说明文档

展示 Demo 操作指南

简要训练流程

项目功能模块说明

模块与目录说明

`demo/` 文件夹

`src/train/` 目录介绍

`DS_train.py`

`Tensorboard.py`

`save.py`

`DS_inference.py`

Author

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

展示 Demo 与模型训练说明文档

展示 Demo 操作指南

简要训练流程

项目功能模块说明

模块与目录说明

demo/ 文件夹

src/train/ 目录介绍

DS_train.py

Tensorboard.py

save.py

DS_inference.py

Author

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

`demo/` 文件夹

`src/train/` 目录介绍

`DS_train.py`

`Tensorboard.py`

`save.py`

`DS_inference.py`

Packages