File tree Expand file tree Collapse file tree 1 file changed +2
-2
lines changed Expand file tree Collapse file tree 1 file changed +2
-2
lines changed Original file line number Diff line number Diff line change @@ -71,7 +71,7 @@ cprofilev -a 0.0.0.0 -p 3214 -f profile.out main.py
71
71
72
72
```
73
73
74
- 可以看到最耗时的函数是C++端的` run ` 函数。这需要联合我们第二节` Python与C++混合代码的性能分析 ` 来进行调优 。而` sync_with_cpp ` 函数的总共耗时很长,每次调用的耗时也很长。于是我们可以点击` sync_with_cpp ` 的详细信息,了解其调用关系。
74
+ 可以看到最耗时的函数是C++端的` run ` 函数。这需要联合我们第二节` Python ` 与 ` C++ ` 混合代码的性能分析来进行调优 。而` sync_with_cpp ` 函数的总共耗时很长,每次调用的耗时也很长。于是我们可以点击` sync_with_cpp ` 的详细信息,了解其调用关系。
75
75
76
76
``` text
77
77
Called By:
@@ -121,7 +121,7 @@ python -m yep -v main.py
121
121
122
122
1 . 编译时指定` -g ` 生成调试信息。使用cmake的话,可以将CMAKE_BUILD_TYPE指定为` RelWithDebInfo ` 。
123
123
2 . 编译时一定要开启优化。单纯的` Debug ` 编译性能会和` -O2 ` 或者` -O3 ` 有非常大的差别。` Debug ` 模式下的性能测试是没有意义的。
124
- 3 . 运行性能分析的时候,先从单线程开始,再开启多线程,进而多机。毕竟如果单线程调试更容易 。可以设置` OMP_NUM_THREADS=1 ` 这个环境变量关闭openmp优化。
124
+ 3 . 运行性能分析的时候,先从单线程开始,再开启多线程,进而多机。毕竟单线程调试更容易 。可以设置` OMP_NUM_THREADS=1 ` 这个环境变量关闭openmp优化。
125
125
126
126
### 查看性能分析文件
127
127
You can’t perform that action at this time.
0 commit comments