Your current environment
The output of `python collect_env.py`
Your output of above commands here
🐛 Describe the bug
vllm-ascend 版本:v0.9.1
模型:Qwen2.5-32B-Instruct
在采用 --compilation-config '{"full_cuda_graph": true}' 后,推理会hang住,通过 py-spy dump 发现卡在 npu 的graph_task_update_end 位置,该如何定位解决呢?
