Set optimizing flags.

Xreki · Xreki · commit 84d28b8c5245 · 2025-11-11T14:41:05.000+08:00
diff --git a/graph_net/paddle/test_compiler.py b/graph_net/paddle/test_compiler.py
@@ -41,6 +41,11 @@ def set_seed(random_seed):
     np.random.seed(random_seed)
 
 
+def init_env(args):
+    if test_compiler_util.is_gpu_device(args.device):
+        paddle.set_flags({"FLAGS_cudnn_exhaustive_search": 1})
+
+
 def get_hardward_name(args):
     hardware = "unknown"
     if test_compiler_util.is_gpu_device(args.device):
@@ -156,7 +161,10 @@ def measure_performance(model_call, args, compiler, profile=False):
         gpu_times = []
 
         if profile:
-            paddle.base.core.nvprof_start()
+            import paddle.profiler as profiler
+
+            p = profiler.Profiler()
+            p.start()
         for i in range(args.trials):
             # End-to-end timing (naive_timer)
             duration_box = test_compiler_util.DurationBox(-1)
@@ -168,6 +176,8 @@ def measure_performance(model_call, args, compiler, profile=False):
                 start_event.record()
                 model_call()
                 end_event.record()
+                if profile:
+                    p.step()
 
             gpu_time_ms = start_event.elapsed_time(end_event)
             e2e_times.append(duration_box.value)
@@ -178,7 +188,8 @@ def measure_performance(model_call, args, compiler, profile=False):
                 flush=True,
             )
         if profile:
-            paddle.base.core.nvprof_stop()
+            p.stop()
+            p.summary()
 
         stats["e2e"] = test_compiler_util.get_timing_stats(e2e_times)
         stats["gpu"] = test_compiler_util.get_timing_stats(gpu_times)
diff --git a/graph_net/paddle/test_reference_device.py b/graph_net/paddle/test_reference_device.py
@@ -131,6 +131,7 @@ def main(args):
     assert args.device in ["cuda"]
 
     test_compiler.set_seed(random_seed=args.seed)
+    test_compiler.init_env(args)
 
     ref_dump_dir = Path(args.reference_dir)
     ref_dump_dir.mkdir(parents=True, exist_ok=True)
diff --git a/graph_net/paddle/test_target_device.py b/graph_net/paddle/test_target_device.py
@@ -167,6 +167,8 @@ def main(args):
     assert os.path.isdir(args.model_path)
     assert args.device in ["cuda", "dcu", "xpu", "cpu"]
 
+    test_compiler.init_env(args)
+
     if path_utils.is_single_model_dir(args.model_path):
         args = update_args_and_set_seed(args, args.model_path)
         test_single_model(args)