Skip to content

Commit db738ae

Browse files
authored
Merge pull request #1044 from NoahZuo/doc/power-perf
doc: 添加新的功耗分析文档
2 parents 3815dd5 + 3bb7d58 commit db738ae

File tree

11 files changed

+191
-0
lines changed

11 files changed

+191
-0
lines changed

.config/.vitepress/config.mts

Lines changed: 1 addition & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -122,6 +122,7 @@ export default defineConfig({
122122
{ text: "性能深度分析工具", link: "/Design/DeepProfileTool" },
123123
{ text: "高精度时间", link: "/Design/HighPreciseTime" },
124124
{ text: "优化实战: Particle Simulate Budget方案", link: "/Design/ParticleBudget" },
125+
{ text: "微信小游戏功耗分析指引 -- iOS 篇", link: "/Design/PowerPerf-iOS" },
125126
],
126127
},
127128
],

Design/PowerPerf-iOS.md

Lines changed: 190 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,190 @@
1+
# 微信小游戏功耗分析指引 --iOS 篇
2+
3+
## 引言
4+
5+
移动互联网快速发展,微信小游戏凭借便捷性和社交性成为热门休闲选择。移动端设备上,微信小游戏的功耗表现对于用户体验具有显著的影响。本文将介绍微信小游戏功耗分析的通用流程,供开发者参考。
6+
7+
## 微信小游戏运行模式
8+
9+
在 iOS 端,微信小游戏具备普通模式、高性能模式和高性能 + 模式三种运行模式。
10+
11+
普通模式下,微信小游戏运行在微信中。
12+
13+
高性能模式下,微信小游戏运行在WebContent进程中。
14+
15+
高性能 + 模式下,微信小游戏的业务逻辑运行在WebContent中,但是小游戏的渲染逻辑则运行在微信进程中。
16+
17+
因此,针对这三种运行模式,我们需要关注不同的进程:
18+
19+
20+
| 模式 | 关注进程 |
21+
| ------ | ----------------- |
22+
| 普通模式 | 微信进程 |
23+
| 高性能模式 | WebContent进程 |
24+
| 高性能+模式 | 微信进程+WebContent进程 |
25+
26+
27+
## 功耗来源介绍
28+
29+
微信小游戏在iOS设备端主要的功耗来源为CPU、GPU、屏幕显示和网络传输。这四大来源中,屏幕显示所占的功耗开销主要取决于玩家的设置与设备的特点(例如:玩家手动将屏幕调亮、iPad设备屏幕较大因此耗电更多),而网络传输的功耗开销更多集中于游戏冷启动阶段。
30+
31+
因此,开发者需要重点关注和优化的是CPU和GPU带宽所带来的功耗开销。就微信小游戏而言,在刨去屏幕显示与网络传输的功耗开销后,CPU和GPU带宽所占功耗开销比例预期约为1.2:1(注:该数值为预估数值,针对不同的游戏品类,该比例亦有差异)
32+
33+
![power-percentage#547px #499px](../image/power-percentage.png)
34+
35+
## 功耗指标
36+
37+
### 电池功耗指标
38+
39+
在小游戏运行时,电池的功耗当然是最直观的评估指标。
40+
41+
当前业界已有若干方案可以采集电池的功耗,可以使用Perfdog等工具进行指标数据的采集。
42+
43+
采集指标时,需要注意如下事项:
44+
45+
* 确保设备当前不处于充电状态(无论是usb还是magsafe)——电池处于充电状态时该数据将完全不可信
46+
47+
* 采集电池功耗时,目前的数据更新周期最快为20s,建议采集时长不低于2分钟
48+
49+
* 采集功耗时,建议将设备的其他应用退出,并且注意将音量、屏幕亮度设置为固定值,避免引入其他影响因子
50+
51+
我们建议微信小游戏的平均功耗不要超过3kmW。若超过该值,则设备将不可避免的出现发热、掉电等情况。
52+
53+
某些优化较好的标杆游戏可以将其控制到2.6kmW,开发者们可以以该功耗值为目标进行优化。
54+
55+
### Power Profiler指标
56+
57+
xcode 26 beta版本中,苹果提供了[Power Profiler](https://developer.apple.com/documentation/Xcode/measuring-your-app-s-power-use-with-power-profiler)工具,用于评估该进程对于功耗的影响。
58+
59+
`Power Profiler`提供了`CPU Impact``GPU Impact``Display Impact``Network Impact`四个维度的数值指标,用于评估一个进程在这四个维度上的耗电情况:
60+
61+
![image.png](../image/power-profiler.png)
62+
63+
值得注意的是:这些数值在四个维度的量纲是一致的,因此这些数值可以跨维度对比,用于判别当前游戏的功耗来源。但是由于不同的设备对应的指标数据评估方法是有差别的,因此这些数值无法跨设备对比。此外,在USB连接中,该值依然可以正常获取。
64+
65+
针对微信小游戏的Power Profiler,可以选择webcontent进程,也可以选择wechat进程进行评估。
66+
67+
68+
由于`Power Profiler`的指标值随着设备类型的不同而不同,因此难以给出一个通用的标杆值进行参考。在此,我们提出相应标杆游戏在`iPhone 15`设备下的值,供开发者们参考:
69+
70+
71+
| Impact类型 | 标杆参考值 |
72+
| ------ | ----------------- |
73+
| CPU Impact | 6.2 |
74+
| GPU Impact | 3.1 |
75+
76+
### 其他指标
77+
78+
#### CPU相关指标
79+
80+
针对计算逻辑开销较重的微信小游戏,除了使用`Power Profiler`里的`CPU Impact`指标进行CPU功耗的评估外,我们可以通过`Perfdog`采集小游戏相关进程的CPU使用率:
81+
82+
![image.3.png](../image/cpu-usage.png)
83+
84+
如果`CPU使用率`指标较高,则意味着当前CPU带来的功耗开销较高,需要进行相应的优化。
85+
86+
注意:不同的运行模式下,需要关注的进程也随之不同。参考`微信小游戏运行模式`小节来确定当前应该监测哪个进程。
87+
88+
我们建议将AppCPU使用率的数值控制在25%以下,标杆游戏可以将该值控制到16%以下。
89+
90+
#### GPU相关指标
91+
92+
##### GPU Bandwidth
93+
在DRAM带宽开销中,因渲染而产生的GPU带宽开销占了绝大部分比重。我们可以通过`Perfdog`里GPU Counter类别中的`GPU Bandwidth`来进行带宽数据的评估:
94+
95+
![image.4.png](../image/gpu-bandwidth.png)
96+
97+
该指标在`Power Profiler`中被归属为GPU Impact。
98+
99+
该指标越低越好,我们建议将Read Bandwidth与Write Bandwidth均控制在10GB/s以下。某些标杆游戏能够做到将其优化到6G/s以下,从而对于发热控制有较好的助益。
100+
101+
102+
##### GPU Usage
103+
104+
使用`Perfdog`,可以获取到整体的`GPU Usage`,该类别包含`Render Utilization``Tiler Utilization``Device Utilization`指标:
105+
106+
![image.5.png](../image/gpu-usage.png)
107+
108+
该指标主要用于OpenGL ES应用的评估,可参考[官方文档](https://developer.apple.com/library/archive/documentation/3DDrawing/Conceptual/OpenGLES_ProgrammingGuide/ToolsOverview/ToolsOverview.html)
109+
110+
111+
针对微信小游戏的GPU使用率评估,该指标也有一定意义。
112+
113+
针对画面要求不高的游戏,我们建议将指标控制在40%以下。针对画面要求较高的游戏,我们也建议将其控制在65%以下。某些标杆游戏可以将该指标控制在60%以下,从而能够进行较好的发热控制。
114+
115+
#### XHR带宽
116+
117+
微信小游戏的高性能+模式运行中,可能涉及到webcontent进程与微信进程的通信。而通信过程中的数据序列化,可能带来带宽的开销。
118+
119+
通过右上角的三点-->开发调试-->打开调试,可以开启调试面板。
120+
121+
![image.6.png#430px #406px](../image/xhr-1.png)
122+
123+
点击左上角的框框,从而可以切换为XHR次数与带宽查看:
124+
![image.7.png](../image/xhr-2.png)
125+
126+
![image.8.png](../image/xhr-3.png)
127+
128+
我们建议在游玩场景时尽量降低XHR次数。某些标杆游戏为可以将XHR次数降低到1,这样可以有效控制XHR通信而导致的带宽功耗。
129+
130+
注:如果场景绘制流程中,有太多的动态合批。可能会导致XHR的通信量显著上升,建议开发者关注。
131+
132+
### 指标建议一览表
133+
134+
135+
| 指标 | 推荐值 | 标杆值 |
136+
| ------ | ------ | ------ |
137+
| 电池功耗 | 3000mW | 2600mW |
138+
| CPU/GPU Impact(iPhone 15设备) | 7.5/5.0 | 6.2/3.1 |
139+
| CPU使用率 | 25% | 16% |
140+
| GPU带宽 | 10GB/s | 6GB/s |
141+
| GPU使用率 | 65% | 60% |
142+
| XHR次数 | 低于3 | 1 |
143+
144+
## 优化方案
145+
146+
当定位到相关的功耗热点后,我们就需要开始着手进行功耗的优化,以下列出一些常见的功耗优化方案:
147+
148+
### 使用GPU Resident Drawer
149+
针对复杂场景的绘制,Unity/团结引擎提供了[GPU Resident Drawer](https://developer.unity.cn/projects/686b447dedbc2a6b14c2915c)的方案,它可以有效降低复杂场景的绘制功耗。
150+
151+
### 关闭HDR
152+
针对微信小游戏,开启HDR将带来约40MB的显存开销,以及一次全分辨率的RT拷贝的操作,从而产生较高的带宽开销。
153+
154+
针对团结引擎,如果使用的是built-in管线,建议前往GraphicsSetting中的tier2(微信小游戏平台使用tier2中的设置)关闭默认开启的hdr。
155+
![image.9.png#692px #238px](../image/turn-off-hdr.png)
156+
157+
针对URP管线,需要在URP Asset中进行HDR渲染的关闭。
158+
159+
### 降低RT的使用
160+
由于RT的使用及切换会显著增加GPU带宽的开销。因此当定位到GPU带宽功耗较高时,应当首先排查是否存在大量使用RT的功能,并且考虑将其降级或禁用。
161+
162+
以下是常见的使用RT的功能:
163+
- Bloom、调色、全屏勾边等后处理效果
164+
- 阴影绘制
165+
- 反射、折射等效果
166+
167+
此外,可以排查渲染管线是否存在以下情况:
168+
- 如果Backbuffer设置成了srgb格式,而后处理需要使用线性空间计算时,则引擎可能会创建一个临时的RT。此时可以考虑将backbuffer改为Linear,从而避免这个临时RT的创建。
169+
- 在Unity针对Webgl平台的渲染管线中,Backbuffer中可能会带有depth信息,从而增大RT的体积。如果你的游戏中不需要深度信息,则可以考虑指定depthBufferBits为0,从而避免自动创建Depth纹理。
170+
- 如果大量使用了高精度的RT,可以考虑将精度降低,例如将R32换成R16。
171+
172+
### 使用压缩率更高的贴图压缩格式
173+
174+
如果是由于贴图尺寸过大而导致GPU带宽开销较高,则可以考虑在表现效果允许的前提下,使用压缩率更高的贴图压缩格式.
175+
176+
### 通过调整DPR值进行渲染分辨率的调整
177+
针对iOS设备,可以通过降低dpr的方式进行渲染分辨率的调整。例如在iOS设备上,如果dpr(Device Pixel Ratio)默认是3.0,那么可以将其尝试设置为[2.0 ~ 2.5]
178+
179+
### 降低CPU功耗开销
180+
当CPU功耗占主导时,我们则需要通过优化CPU效率的方式进行功耗的优化,本文提出以下方向供开发者参考:
181+
- GPU Skin
182+
当场景内存在大量的Skinned Mesh Renderer时,CPU蒙皮将带来很大的CPU开销。团结引擎已经提供了GPU Skinning的支持,开发者们也可以自行实现GPU Skinning的功能,从而降低蒙皮带来的CPU功耗开销。
183+
- 粒子模拟优化
184+
如果场景内的粒子数量较多,则粒子更新将会带来繁重的CPU开销。可以尽量使用Local Space Simulation、合理的粒子LOD设置来降低粒子的更新开销;也可以手动设置Particle Simulation Budget方案,从而进行总体的控制。此外,针对发射数量较少的粒子,可以考虑直接使用Mesh来进行模拟,从而减轻CPU的负担。
185+
- 使用性能深度分析工具来定位性能瓶颈
186+
针对未知的CPU开销,可以考虑使用性能深度分析工具来定位CPU的性能瓶颈。
187+
188+
### 控制帧率
189+
190+
我们可以通过调整帧率的方式,从而以最直观的方式降低游戏整体的功耗。开发者们可以根据自身的需求,设置目标帧率,或者将目标帧率进行动态调整,从而控制游戏整体的功耗。

image/cpu-usage.png

136 KB
Loading

image/gpu-bandwidth.png

155 KB
Loading

image/gpu-usage.png

135 KB
Loading

image/power-percentage.png

280 KB
Loading

image/power-profiler.png

754 KB
Loading

image/turn-off-hdr.png

202 KB
Loading

image/xhr-1.png

539 KB
Loading

image/xhr-2.png

161 KB
Loading

0 commit comments

Comments
 (0)