File tree Expand file tree Collapse file tree 6 files changed +31
-1
lines changed
docs/user_manual/operation_and_maintenance/emergency_handbook
static/img/user_manual/operation_and_maintenance/emergency_handbook/03_cpu_high Expand file tree Collapse file tree 6 files changed +31
-1
lines changed Original file line number Diff line number Diff line change @@ -57,4 +57,34 @@ top -p `pidof observer` -H
5757
5858#### 如果是后台线程的 CPU 占用大
5959
60- 如果 top -H 看到占用 CPU 的是 T1_HBService、RootBalance、IO_GETEVENT0 这类看不懂的线程 CPU 占用高,建议去社区论坛发帖,联系在论坛中值班的技术支持同学,让他们协助你留下 obstack 或者 pstack 的堆栈信息,进一步分析原因。
60+ 如果 top -H 看到占用 CPU 的是 T1_HBService、RootBalance、IO_GETEVENT0 这类看不懂的线程 CPU 占用高,建议去社区论坛发帖,联系在论坛中值班的技术支持同学,让他们协助你留下 obstack 或者 pstack 的堆栈信息,进一步分析原因。
61+
62+
63+ ## What' more ?
64+
65+ > 这一小节的第一版,其实到这里就结束了。后面都是再版时补充的内容。
66+
67+ 写完之后,突然想起我老大在一段时间之前好像跟我简单提过一句,说有机会的话,希望能够向用户介绍如何充分利用 OCP 的白屏监控。
68+
69+ 一直没写 OCP 监控的内容,原(jiè)因(kó)是,白屏操作太易用了,自己随意拿鼠标点一点,大概率也就玩儿明白了。大多数情况下,连官网文档都不需要。
70+
71+ 这里测试一下不看官方文档,直接通过 OCP 来分析 CPU 负载异常吧,顺便做个记录,正好向大家证明 OCP 白屏监控的易用性。
72+
73+ - 首先在 2024/11/21 20:37 左右,给数据库加一点儿压力。
74+
75+ - 然后在 OCP 首页的 “性能监控” 中的 “OBServer 性能” 里,就能看到对应集群 CPU 使用率一下子就快跑满了(“性能监控” 四个字就在首页,不需要到处找)。
76+ ![ image] ( /img/user_manual/operation_and_maintenance/emergency_handbook/03_cpu_high/004.png )
77+
78+ - 再然后,在 “数据库性能” 里,可以看到这个集群的 SQL 响应时间也大幅上升。
79+ ![ image] ( /img/user_manual/operation_and_maintenance/emergency_handbook/03_cpu_high/005.png )
80+
81+ - 再再然后,就可以去看下这个集群里各个租户的情况,发现一个叫做 mysql 的用户租户,情况比较特殊,CPU 使用率很高。
82+ ![ image] ( /img/user_manual/operation_and_maintenance/emergency_handbook/03_cpu_high/006.png )
83+ ![ image] ( /img/user_manual/operation_and_maintenance/emergency_handbook/03_cpu_high/007.png )
84+
85+ - 点一下 “SQL 诊断”,就可以看到是这个集群里,一个叫 mysql 的租户,正在疯狂重复执行一条计算逻辑超级复杂的 SQL。
86+ ![ image] ( /img/user_manual/operation_and_maintenance/emergency_handbook/03_cpu_high/008.png )
87+
88+ - 到此为止,问题定位。
89+
90+ 虽然我这个是先知道答案,再展示解题过程。不过,这里想证明的其实是,不看官网的 OCP 文档,大家也能轻松利用 OCP 的白屏监控来分析 CPU 使用率异常的问题,只要自信地去用就好了(希望别被我老大看到)~
You can’t perform that action at this time.
0 commit comments