代码中,提供了两种多卡并行方式: DistributedDataParallel 和 DataParallel, 请问:1. 您在使用这两种方式进行训练时,运行时间差别大吗? 2. 我使用 v-100 运行 link prediction 任务时,花了近1周时间还没结果,您是否有其他方式进行加速? 谢谢。