Skip to content

Commit f5ca8d0

Browse files
committed
Merge branch 'master' of https://github.com/Dramwig/flowline
2 parents 548e647 + d139b42 commit f5ca8d0

File tree

1 file changed

+3
-10
lines changed

1 file changed

+3
-10
lines changed

readme.md

Lines changed: 3 additions & 10 deletions
Original file line numberDiff line numberDiff line change
@@ -14,14 +14,12 @@ FlowLine 是一个用于 **GPU资源管理** 和 **并发指令流调度** 的
1414
* 🧩 **系统概要设计**:详见 [概要设计](./docs/design.md)
1515
* 🏗️ **系统架构详解**:详见 [架构说明](./docs/arch.md)
1616

17-
该系统的设计初衷是为了替代手动监控 GPU 状态并依次执行命令的低效方式。在传统流程中,用户需要持续关注 GPU 的显存占用和利用率,还可能cuda out of memory,以便手动启动 Python 脚本或终止进程,这在多任务实验场景中尤为繁琐。本项目通过自动化机制解决了这些问题,提升了实验效率与资源利用率。
18-
1917
本系统的设计初衷在于替代传统的手动 GPU 监控与命令执行流程,从而提升实验效率。在传统方式下,用户需持续关注 GPU 的显存占用与利用率,并可能因 CUDA 内存不足(CUDA Out of Memory)而中断任务,需要手动启动或终止 Python 脚本。这种操作在多任务实验场景中尤为繁琐。本项目通过自动化管理机制,提升了实验效率与资源利用率。
2018

2119
## 核心特性
2220

2321
* 实时 GPU 状态监控:自动检测可用 GPU 数量、显存占用、进程信息等、并根据自定义优先函数排序;
24-
* **报错自动处理**:错误中断后自动重新入队而解决 CUDA Out of Memory 等非程序BUG;
22+
* 报错自动处理:错误中断后自动重新入队而解决 CUDA Out of Memory 等非程序BUG;
2523
* 命令调度与资源控制:支持配置每条命令所需 GPU 数量、显存下限、最大并行数等条件;
2624
* 动态调控机制:可手动终止或重启进程,实现任务队列灵活管理;
2725
* 多任务并发执行:支持任务优先级队列、失败重试等策略,适用于批量实验运行;
@@ -110,9 +108,7 @@ if __name__ == "__main__":
110108
<details>
111109
<summary>user_cmp 可用参数表</summary>
112110

113-
info1、info2其实是 [gpu.py](.flowline/core/gpu.py) 的 GPU_info 对象的实例,其可用作比较函数的参数有:
114-
115-
可以用一个 Markdown 表格清晰地表示 `GPU_info` 类中每个参数的含义:
111+
info1、info2其实是 [gpu.py](.flowline/core/gpu.py)`GPU_info` 对象的实例,类中每个参数都可用于比较函数内,分别如下:
116112

117113
| 参数名 | 类型 | 含义说明 |
118114
| ------------------ | --------- | ------------------------------------------------------------- |
@@ -126,9 +122,6 @@ info1、info2其实是 [gpu.py](.flowline/core/gpu.py) 的 GPU_info 对象的实
126122
| `temperature` | int/float | GPU 当前温度(单位通常为摄氏度 °C) |
127123
| `power` | float | GPU 当前功耗(单位通常为瓦特 W) |
128124
| `max_power` | float | GPU 最大设计功耗(单位瓦特 W) |
129-
130-
如果你需要,我可以帮你画一个**可视化示意图**,把 GPU 状态参数和它们的含义一目了然地展示出来,这在文档或汇报中很直观。你希望我画吗?
131-
132125
</details>
133126

134127
<details>
@@ -213,7 +206,7 @@ python test/example1_cli.py
213206
</details>
214207
</details>
215208

216-
### 🌐 使用 Web 界面(可视化任务管理
209+
### 🌐 使用 Web 界面(Beta
217210

218211
> **无需额外配置,FlowLine 默认支持在 SSH 环境下运行**
219212

0 commit comments

Comments
 (0)