Skip to content

Conversation

@fangfangssj
Copy link
Contributor

@fangfangssj fangfangssj commented Dec 28, 2025

PR Category

Bug Fix

Description

修复了子图分解部分case失败的问题

在Dynamo捕捉计算图的过程中,s0,s1等symint(0-d tensor,torch.int64)因为没有被实际使用而会被优化掉,最后捕捉到的计算图会去掉这些输入,但是我们创建的input中是包含着的,需要补全回来
之前的逻辑是只补全一个symint参数,而现在是将所有的symint全量补全,修复了symint大于1的例子(如googlenet中存在两个symint参数)

GraphNet torch计算图反序列化可用性研究与优化。GraphNet项目会不断的序列化反序列化计算图。实践表明,torch计算图的反序列化很不稳定,形式化的来讲:torch_unserialize(torch_serialize(graph)) != graph。这个失败的概率大概在10%,而且torch不同版本成功率不一样。由于计算图反序列化是GraphNet子图切分工作的基石,我们有必要提升这里的可用性。

本PR中,子图分解部分会大幅度提高成功率

@paddle-bot
Copy link

paddle-bot bot commented Dec 28, 2025

Thanks for your contribution!

@paddle-bot paddle-bot bot added the contributor External developers label Dec 28, 2025
@lixinqi
Copy link
Collaborator

lixinqi commented Dec 29, 2025

请提交这个pr前后的ES指标对比。

@fangfangssj
Copy link
Contributor Author

fangfangssj commented Dec 29, 2025

请提交这个pr前后的ES指标对比。

测试脚本 https://github.com/PaddlePaddle/GraphNet/blob/develop/graph_net/test/fx_graph_module_unserialize_test.sh
提交PR前
有无法画图的报错,简单的debug发现,是没有对报错的样本处理
4cacdfcf-b0af-4fd0-ac98-42807c45f0fd
提交PR后
ESt_result

@lixinqi lixinqi merged commit cdf9f09 into PaddlePaddle:develop Dec 29, 2025
3 checks passed
@fangfangssj fangfangssj deleted the fix_bug branch December 30, 2025 02:21
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

contributor External developers

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants